« 2020年4月 | トップページ | 2020年7月 »

2020年5月

2020.05.16

ScrapBook及びSave Page WEで保存したWebページをApache Solrで検索できるようにしてみた(その2)

Apache SolrにWebページのテキストデータを登録するところまでを
ScrapBook及びSave Page WEで保存したWebページをApache Solrで検索できるようにしてみた(その1)
に書きました。今回は、WebブラウザをクライアントにしてApache Solrからテキスト検索する簡単なサンプルコードを書いてみます。

Apache Solrが起動しているとき、標準的には、http://localhost:8983/solr/scrapbook/select?q=pythonのような形でテキスト検索を実行できます。するとJSON形式のレスポンスが返ってきます。これを一歩進めてWebブラウザをクライアントにした簡単なテキスト検索システムを作ります。

続きを読む "ScrapBook及びSave Page WEで保存したWebページをApache Solrで検索できるようにしてみた(その2)"

| | コメント (0)

2020.05.14

ScrapBook及びSave Page WEで保存したWebページをApache Solrで検索できるようにしてみた(その1)

以前、ローカルに保存したWebページのインデックス作成について書きました。

ScrapBookのリンク静的HTMLファイル作成スクリプト
Save Page WE及びScrapBookのインデックスリンク静的HTMLファイル作成スクリプト

ファイル数が増えてきたこともあり、今回はこれまで蓄積してきたWebページをApache Solrを使ってテキスト検索できるようにしてみましたので、その手順をメモ。
今回はその事前準備として、macOS Catalina起動時にApache 2及びApache Solrが自動起動するように設定します。さらに、蓄積されたWebページをインデキシングするまでを扱います。

続きを読む "ScrapBook及びSave Page WEで保存したWebページをApache Solrで検索できるようにしてみた(その1)"

| | コメント (0)

« 2020年4月 | トップページ | 2020年7月 »