「データは新たな石油」。英国の数学者でありデータサイエンスの起業家でもあるクライヴ・ハンビーは、2006年に「データは新たな石油」というフレーズを作り出したと言われています。それ以来、このフレーズは私たちの社会で最も重要でよく使われるフレーズの1つとなっています。石油が最も影響力のある要素の1つであるように、データはこのテクノロジーのお土産の時代に石油の役割を果たしています。
データは物理的な製品とは異なる特性を持っているため、特に価格設定の仕組みに関して、取引される商品に関する確立されたプロセスやルールを直接移転することが困難です。取引データに関しては、支払い意欲は低いです。
たとえば、データまたはデータサービスの購入者は、購入前にその潜在的な価値を認識しないことがよくあります。さらに、人々は高品質データの作成、処理、保存、分析がデータおよびデータサービスプロバイダーにとって主要なコスト要因であることをしばしば認識していません。もう一つの障害は信頼と安全性の欠如であり、潜在的なデータプロバイダーは競合他社が内部データを開示することで利益を得ることを心配しています。
公共所有アプローチ
データの収集、処理、検証に対する分散型アプローチは、中央集権型システムの内在的な欠点のために重要です。従来のモデルでは、大企業がデータをコントロールし、個人が自分の個人情報に対する所有権やコントロールを奪われ、重大なプライバシーの懸念を引き起こし、信頼を損なっています。さらに、中央集権型システムはしばしばデータサイロを作成し、データのシームレスな統合と利用を妨げ、非効率性とAIの進展の遅延を招きます。
分散化は、個人が自分のデータを完全に制御できるようにし、プライバシーを確保しつつ、エコシステム全体でより効率的でアクセス可能なデータ交換を促進します。
さらに、中央集権型システムはデータの品質と検証を維持する際に課題に直面します。一つのエンティティがデータを検証すると、バイアスや不正確さのリスクが高まり、AIモデルのパフォーマンスを損なう恐れがあります。それに対して、分散型ネットワークは独立した参加者間で検証責任を分配し、より信頼できる偏りのないデータセットを確保します。
ブロックチェーン技術を利用することで、分散化は透明性、説明責任、信頼性を高め、貢献者と開発者の双方に利益をもたらす安全で効率的かつ公平なデータ交換環境を創出します。
データインテリジェンスネットワーク
DIN(分散型インテリジェンスネットワーク)は、ブロックチェーンと人工知能を融合させて分散型データエコシステムを確立する変革的なプラットフォームです。データの収集、処理、収益化のための構造化されたフレームワークを提供し、セキュリティ、透明性、ユーザーコントロールを強調します。DINはデータ管理の方法を再定義し、個人や団体が生成する情報をキュレーションし、保護し、価値を引き出す能力を提供します。
DINがデータを収集する方法
DINは、その革新的なシステム、主にxDataとチッパーノードを通じてデータを収集します。xDataは、ユーザーが中央集権的なAPIに依存することなく、ツイートなどのデジタルコンテンツをシームレスにキャプチャして保存できるブラウザベースのツールです。この分散型アプローチにより、データは暗号化され、安全で、完全に所有者によって制御されることが保証されます。
チッパーノードは、このプロセスを補完し、洗練されたデータ処理ユニットとして機能します。彼らは生データを検証、クリーンアップ、強化し、エッジコンピューティングを利用して低遅延で効率的な操作を確保します。xDataとチッパーノードが一緒になって、高品質のデータをキュレーションしながらユーザーの自律性とプライバシーを保護するための一貫したメカニズムを作り出します。
DINの重要なコンポーネント
1. xData
2. チッパーノード
3. データバリデーターとベクトライザー
4. 分散型ストレージ。
なぜデータ検証が必要なのか
データ検証は、情報の完全性と正確性を維持するために不可欠です。それは提出物が信頼できるものであることを保証し、不正確または有害なデータがシステムに入らないようにします。検証がなければ、データセットの品質が低下し、機械学習モデルの効果と信頼性が低下する可能性があります。
DINがデータ検証を実行する方法
DINは、貢献を検証するために分散型およびブロックチェーンベースのアプローチを採用しています。誰かがデータを提出すると、そのデータはメタデータとともにブロックチェーンに安全にログされます。貢献者は自分のデータの正確性を保証するためにデポジットをステークします。バリデーションノードがデータの質とモデルへの関連性を評価します。承認されると、貢献者は報酬とデポジットを返されます。拒否された場合、データは他の人によって異議を唱えられ、修正されることができ、ペナルティと報酬が公平に再分配されます。
このことを考える簡単な方法は、近所のトリビアゲームのようなものです。参加者は、真剣に取り組むことを保証するために小さな保証金を伴って回答を提出します。パネルはこれらの回答をチェックし、正しい回答をした者を報酬します。間違いは他の人によってフラグされ、修正されることができ、全体のゲームが正確で楽しい状態を維持します。
プロセスはスムーズに流れ、提出から正確な貢献に対する報酬または不正確さへのペナルティまで続きます。
XData
xDataは、2024年4月にopBNB上で開始されたDIN内の分散型データ管理プラットフォームです。AIとブロックチェーンを組み合わせて、ツイートのような散発的な情報を整理、保存、収益化します。中央集権的な方法とは異なり、xDataは分散型のスクレイピングと暗号化を使用してユーザーデータを保護し、プライバシーを確保します。ユーザーはライブラリを構築し、オンチェーンで情報を安全に保存し、データの収益化を通じて報酬を得ることができます。
機能とユースケース:
1. ブラウザ拡張を使用してツイートをシームレスに収集して保存します。
2. プラットフォームの制限を回避するために分散型スクレイピングを使用します。
3. キュレーションされたツイートコレクションを販売して収益化する。
4. すべてのデータをブロックチェーン上で安全に暗号化して保存し、完全な所有権を確保します。
チッパーノード
チッパーノードは、DINエコシステムの重要なコンポーネントであり、データ検証、処理、および報酬計算を処理するために設計されています。エコシステムが効率的に機能することを保証するために、データフローを管理し、合理化するための基盤として機能します。DINでは、チッパーノードはデータコレクターによって収集された生データの前処理のための橋渡し役を果たします。
これには、AIの使用のためにデータを検証、分類、クリーンアップ、強化することが含まれます。エッジコンピューティングを活用することで、チッパーノードはデータをそのソースに近い場所で処理し、遅延を減らし、パフォーマンスを向上させます。
これらのノードは、fastTextのような小さな言語モデルが多言語テキストを迅速かつ正確に処理できるようにし、これはグローバルなAIアプリケーションにとって不可欠です。さらに、チッパーノードはネットワーク内での報酬の分配を管理し、計算努力を参加者と共有される利益に変換します。
これにより、参加者の貢献を奨励し、DINエコシステムの継続的な成長を促進するための重要な要素となります。
ベクトライザー
ベクトライザーはデータ前処理パイプラインの一部です。彼らは生の非構造化データ(ツイートやその他のテキスト入力など)を、機械学習モデルによって効率的に分析および処理できる構造化された数値ベクトルに変換します。
DINのベクトライザーは、データをトレーニングおよび検証のために準備し、エコシステム内で動作するモデルと互換性を持たせる手助けをします。彼らはデータバリデーターと協力して、データが正確でクリーンであり、さらに使用する準備ができていることを確認し、最終的に高品質な入力を提供することでモデルのパフォーマンスを向上させます。
🟪 一部のGoodreads
🎯 データは常に分散化において重要な要素です。運動の初めから、データは重要な役割を果たしてきました。大手テクノロジー企業は私たちのすべてのデータと情報の守護者として機能していますが、時にはそれが極端で悪用されることもあります。したがって、公共の所有による分散型ソリューションが必要であり、私たちはこれが将来的に大きくスケールアップすると信じています。
🔼 データクレジット
> DINドキュメント
> Messari
> 4つの柱
> Inery
> Coinmarketcap
🅃🄴🄲🄷🄰🄽🄳🅃🄸🄿🅂123