SearXNG のセルフホスティング

SearXNG に関する詳細

目次

SearXNG は、Searx からフォークされた無料のオープンソースの連邦メタ検索エンジンです。 GitHub 上の SearXNG プロジェクト は、1 万 5000 以上のスターを獲得しています。

SearXNG は、70 以上の異なる検索エンジンやサービスからの検索結果を集約し、それを単一の包括的なリストとして提示します。

これは、オブジェクトストレージ、データベース、検索、AI データアーキテクチャを涵盖する、より広範な AI システムのためのデータインフラストラクチャ の一部です。

私は、perplexica と連携して動作する仕組みが非常に気に入りました。

searxng この美しい PC コンプオネントの画像は、AI モデル Flux 1 dev によって 作成 されたものです。

SearXNG の主な機能

SearXNG の主な機能は以下の通りです:

  1. プライバシー重視: SearXNG はユーザー情報を収集せず、検索を追跡したり、ユーザープロファイルを作成したりしません。

  2. カスタマイズ可能: ユーザーは検索設定、テーマをパーソナライズし、使用する検索エンジンを選択できます。

  3. セルフホスティングオプション: 検索エンジンおよび関連データに対する完全な制御を行うために、ローカルネットワークまたは個人用コンピュータにインストールできます。

  4. オープンソース: プラットフォームはコラボレーションとコミュニティ主導の開発を歓迎しています。

  5. 広告なしの体験: SearXNG は広告やトラッキングコンテンツを提供しません。

  6. Tor 互換性: 匿名性を高めるために、検索クエリを Tor ネットワーク経由でルーティングすることができます。

SearXNG はカテゴリ別検索を提供し、ユーザーが結果を「Web」、「画像」、「動画」、「ニュース」などの標準カテゴリや、「ソーシャルメディア」、「音楽」、「ファイル」、「IT」、「科学」などの非標準カテゴリに分類することを可能にします。

このメタ検索エンジンは、検索サービスおよび結果ページに送信されるリクエストから個人データを除去し、ユーザーのプライバシーを確保します。これはパブリックインスタンスまたはプライベートインスタンスからアクセスでき、パブリックインスタンスのリストは searx.space で利用可能です。

SearXNG のセルフホスティング

SearXNG は、独自のサーバーまたは個人用コンピュータにインストール可能な無料のオープンソースメタ検索エンジンです。SearXNG をセルフホスティングすることにはいくつかの利点があります:

  1. プライバシーの制御: 検索データに対して完全な管理権限を持ち、そのデータが収集または共有されていないことを確認できます。
  2. カスタマイズ: 設定、テーマをパーソナライズし、使用する検索エンジンを選択できます。
  3. 広告なしの体験: SearXNG は広告やトラッキングコンテンツを提供しません。

しかし、SearXNG をセルフホスティングする際には、いくつか考慮すべき点があります:

  1. プライバシーのトレードオフ: セルフホスティングインスタンスの唯一のユーザーである場合、検索は基礎となる検索エンジンにより容易に特定される可能性があります。
  2. 技術知識: セルフホスティングインスタンスのセットアップと維持には、ある程度の技術スキルが必要です。
  3. リソース要件: SearXNG インスタンスを実行するためのサーバーまたはコンピュータが必要です。

SearXNG をセルフホスティングするには、簡単なインストールと管理のために Docker を使用できます。プロセスは通常、以下の手順を含みます:

  1. サーバーまたはコンテナ環境のセットアップ
  2. SearXNG Docker リポジトリのクローン
  3. アプリケーションの構成
  4. Docker コンテナの実行

セルフホスティングは制御性とカスタマイズ性を提供しますが、SearXNG をセルフホスティングするかどうかを決定する前に、プライバシーへの影響と技術要件を慎重に検討することが重要です。

セルフホスティングにおける SearXNG の技術要件

SearXNG は、小型のシングルボードコンピュータからより強力なサーバーまで、様々なハードウェア構成でホストすることができます。SearXNG をホストするためのハードウェア要件は比較的軽量です:

  1. プロセッサ: 64 ビットシステムが推奨されます。単一コアでも、小規模な利用には十分です。

  2. RAM: 最小 512MB、より良いパフォーマンスのためには 2GB 以上が推奨されます。

  3. ストレージ: Docker コンテナは約 300MB のスペースを必要とします。利用状況やログ要件に応じて追加のストレージが必要になる場合があります。

  4. ネットワーク: 安定したインターネット接続が必要ですが、帯域幅要件はユーザー数によって異なります。

これらの仕様は、小到中規模の SearXNG インスタンスをサポートできます。例えば:

  • Raspberry Pi 4 は快適に SearXNG を実行できます。
  • 一部のユーザーは、vCPU 1 つと RAM 512MB だけの仮想プライベートサーバー(VPS)上で SearXNG を成功裏にホストしています。

ただし、実際の要件は以下の要因によって異なる場合があります:

  • 同時接続ユーザー数
  • 検索ボリューム
  • 有効な機能やプラグイン

大規模なデプロイメントや高いパフォーマンスを必要とする場合は、より強力なハードウェアを検討する必要があるかもしれません。インスタンスのパフォーマンスを監視し、必要に応じてリソースを調整することは常に良い実践です。

SearXNG の統合

SearXNG は主にプライバシー重視のメタ検索エンジンであり、ホームオートメーションシステムとの直接の統合機能はありません。SearXNG は Web 検索のために設計されており、ホームオートメーションエコシステムの固有の一部ではありません。

SearXNG と並行して Elasticsearch を使用している方々にとって、Elasticsearch チートシート は、Elasticsearch クラスタを管理するための本質的なコマンドとヒントを提供します。

しかし、SearXNG をホームオートメーションと組み合わせて使用できる間接的な方法がいくつかあります:

  1. API 統合: SearXNG は結果を JSON 形式で出力するように構成でき、理論的には他のアプリケーションやシステムで使用できます。

  2. カスタムアプリケーション: 開発者は、SearXNG の検索機能を利用し、それをホームオートメーションシステムに統合するカスタムアプリケーションを作成できる可能性がありますが、これには多大な開発労力が必要です。

  3. 情報取得: SearXNG は、プライバシーを尊重する検索ツールとして、ホームオートメーションシステムやトラブルシューティングに関する情報を見つけるために使用できますが、これは自動化された統合ではなく手動のプロセスになります。

SearXNG はホームオートメーションツールとして設計されていないことに注意してください。包括的なホームオートメーション統合については、この目的のために特別に設計されたプラットフォームを検討することをお勧めします。例えば:

  • Home Assistant: 様々なスマートホームデバイスやシステムを統合できるオープンソースのホームオートメーションプラットフォームです。
  • Hubitat: Z-Wave、Zigbee、Wi-Fi デバイスを処理して相互運用性の問題を解決できるハブです。
  • Apple HomeKit: Apple デバイスを使用する方々にとって、様々なスマートホーム製品との統合を提供します。

これらのプラットフォームは、異なるホームオートメーションシステムやデバイスを統一されたインターフェースと制御システムに統合するために適しています。

Perplexica のデプロイメントの一部としての SearXNG

SearXNG は Perplexica の一部として重要な役割を果たし、Perplexica の AI 強化検索機能を支える基盤となる検索エンジンとして機能します。SearXNG が Perplexica とどのように統合されるかは以下の通りです:

  1. 検索の基盤: SearXNG は Perplexica の基盤となる検索エンジンとして機能し、70 以上の異なる検索エンジンやサービスからの結果を集約します。

  2. プライバシー重視: Perplexica は SearXNG のプライバシーファーストのアプローチを活用し、ユーザー検索が追跡またはプロファイリングされないことを保証します。

  3. 統合プロセス: Perplexica をインストールする際、SearXNG は自動的にセットアップに含まれます。スタンドアロン版が欲しい場合を除き、ユーザーは SearXNG を別途インストールする必要はありません。

  4. ワークフロー: ユーザーが Perplexica にクエリを送信すると、以下のプロセスが発生します:

    • 自然言語クエリは言語モデル(例:Llama 3.1)を使用してキーワードに変換されます。
    • これらのキーワードは実際の検索のために SearXNG に渡されます。
    • SearXNG は結果を Perplexica に返します。
    • Perplexica は結果をフォーマットしてユーザーに提示します。
  5. ローカルデプロイメント: Perplexica と SearXNG の両方をローカルにインストールでき、ユーザーは自身のハードウェア上でプライバシー重視の AI 検索エンジンを実行できます。

  6. カスタマイズ: ユーザーは Perplexica 内の SearXNG を構成でき、他のツールやアプリケーションとの統合のために JSON 形式を設定することもできます。

SearXNG の堅牢な検索機能と AI 駆動機能を組み合わせることで、Perplexica は Perplexity や Google の AI 検索などの商業用 AI 検索エンジンに対する包括的でプライバシーを尊重する代替案を提供することを目指しています。

SearXNG とプライバシー

SearXNG は複数のメカニズムを通じてプライバシーを確保します:

  1. 個人データの除去: SearXNG は検索リクエストから個人情報を以下の 3 つの方法で除去します:

    • 検索サービスに送信されるリクエストから個人データを排除する
    • 検索サービスを通じてサードパーティのコンテンツ(広告など)を転送しない
    • 結果ページに送信されるリクエストから個人データを除去する
  2. 匿名化: SearXNG はすべてのリクエストに対してランダムなブラウザプロファイルを生成し、外部の検索エンジンにクッキーを送信しません。

  3. IP 保護: 検索エンジンによって見られる IP アドレスは、ユーザーのものではなく、SearXNG インスタンスのものになります。SearXNG は追加の IP 保護のためにプロキシまたは Tor を使用するように構成できます。

  4. データ収集なし: SearXNG は個人データを収集せず、ユーザーの検索が機密保持されることを保証します。

  5. 広告やトラッキングなし: ほとんどの検索サービスとは異なり、SearXNG は広告やトラッキングコンテンツを提供しないため、個人データがサードパーティに転送されるのを防ぎます。

  6. 結果ページのプライバシー: 参照元ページと検索クエリの両方が訪問した結果ページから隠されます。

  7. クッキーなしのカスタマイズ: ユーザーはクッキーに依存することなく設定をパーソナライズでき、プライバシーを強化します。

  8. オープンソースの性質: オープンソースであることは、コミュニティによる監査とプライバシー主張の検証を可能にします。

これらの措置を実装することで、SearXNG は、クエリ、選択された言語、必要な技術パラメータのみが検索エンジンに送信される、プライバシー重視の検索体験を提供します。

参考リンク