ChainCatcher メッセージ、バブソン学院卒業生のシドニー・ハン(Sydney Huang)氏は本日、Human APIのリリースを発表しました。これは、AIシステムが直接人間と協働し、現実世界のデータや労働力を取得できる新しいプラットフォームです。ハン氏はまた、Human APIの背後にある会社Eclipse LabsのCEOも務めています。
「AIインテリジェントはもはや知能レベルに制限されていません」とハン氏は述べています。「制限されているのは物理的な世界へのアクセスです。Human APIの存在は、そのギャップを埋めるためのものです。」
Human APIは、企業が称する自律型AIインテリジェントの「ラストワンマイル問題」を解決することを目的としています。現代のインテリジェントはデジタル環境で推論、計画、タスク実行が可能ですが、多くの経済価値のある活動には依然として人間の関与が必要です。例えば、配送の完了、データ収集、API未接続の機関とのやり取りなどです。Human APIは、インテリジェントに標準化されたインターフェースを提供し、これらの作業をリクエスト、調整し、人間に報酬を支払うことを可能にします。
このプラットフォームは、ローンチ初期には最も制限されている入力形式の一つである音声データに重点を置きます。音声は情報密度の高いモダリティであり、言語、アクセント、感情、リズム、背景環境などの情報を含みます。しかし、認証制限、圧縮の歪み、メタデータ不足により、高品質でラベル付け可能な音声データの規模的収集は困難です。そのため、多くの音声およびマルチモーダルモデルは、非英語言語、地域アクセント、バイリンガル音声、重複した会話、微妙な感情表現においてパフォーマンスが低いです。
Human APIは、世界中の貢献者が標準的な消費者向けデバイスを使用して高品質な多言語音声を提供できるようにし、参加のハードルを大幅に下げます。企業は、この方法により、信頼性の高い取得や合成による生成が難しいデータをAIシステムが取得できると述べています。
まだ非公開運用段階にありますが、Human APIはすでに最初の企業向け有料データ提供を完了し、市場の需要を検証しています。一方はより高カバレッジのデータセットを求めるバイヤー、もう一方はこれらのデータを提供したい貢献者です。
Anagramのパートナー兼Human APIの投資家であるDavid Feiockは、「AIインテリジェントは推論において非常に強力ですが、最後の一マイルでは依然として課題があります。そこでは調整、データ収集、人間の判断が必要です。Human APIの魅力は、人間をインフラストラクチャとして捉えている点にあります。これはホスティング型サービスや汎用的なクラウドソーシングではなく、インテリジェントに向けた権利保護を重視した仕組みであり、人間をシステムに組み込み、即時支払いを実現します」と述べています。
Human APIは今後、音声以外の人間提供データ形式や現実世界のタスク実行への拡張を計画しています。現在、同プラットフォームは thehumanapi.com で貢献者登録を受け付けています。
13.63K 人気度
18.47K 人気度
56.24K 人気度
15.37K 人気度
94.82K 人気度
シドニー・黄は、AIシステムが現実世界の労働力を獲得できるように設計された、エージェント向けのネイティブプラットフォームであるHuman APIを発表しました。
ChainCatcher メッセージ、バブソン学院卒業生のシドニー・ハン(Sydney Huang)氏は本日、Human APIのリリースを発表しました。これは、AIシステムが直接人間と協働し、現実世界のデータや労働力を取得できる新しいプラットフォームです。ハン氏はまた、Human APIの背後にある会社Eclipse LabsのCEOも務めています。
「AIインテリジェントはもはや知能レベルに制限されていません」とハン氏は述べています。「制限されているのは物理的な世界へのアクセスです。Human APIの存在は、そのギャップを埋めるためのものです。」
Human APIは、企業が称する自律型AIインテリジェントの「ラストワンマイル問題」を解決することを目的としています。現代のインテリジェントはデジタル環境で推論、計画、タスク実行が可能ですが、多くの経済価値のある活動には依然として人間の関与が必要です。例えば、配送の完了、データ収集、API未接続の機関とのやり取りなどです。Human APIは、インテリジェントに標準化されたインターフェースを提供し、これらの作業をリクエスト、調整し、人間に報酬を支払うことを可能にします。
このプラットフォームは、ローンチ初期には最も制限されている入力形式の一つである音声データに重点を置きます。音声は情報密度の高いモダリティであり、言語、アクセント、感情、リズム、背景環境などの情報を含みます。しかし、認証制限、圧縮の歪み、メタデータ不足により、高品質でラベル付け可能な音声データの規模的収集は困難です。そのため、多くの音声およびマルチモーダルモデルは、非英語言語、地域アクセント、バイリンガル音声、重複した会話、微妙な感情表現においてパフォーマンスが低いです。
Human APIは、世界中の貢献者が標準的な消費者向けデバイスを使用して高品質な多言語音声を提供できるようにし、参加のハードルを大幅に下げます。企業は、この方法により、信頼性の高い取得や合成による生成が難しいデータをAIシステムが取得できると述べています。
まだ非公開運用段階にありますが、Human APIはすでに最初の企業向け有料データ提供を完了し、市場の需要を検証しています。一方はより高カバレッジのデータセットを求めるバイヤー、もう一方はこれらのデータを提供したい貢献者です。
Anagramのパートナー兼Human APIの投資家であるDavid Feiockは、「AIインテリジェントは推論において非常に強力ですが、最後の一マイルでは依然として課題があります。そこでは調整、データ収集、人間の判断が必要です。Human APIの魅力は、人間をインフラストラクチャとして捉えている点にあります。これはホスティング型サービスや汎用的なクラウドソーシングではなく、インテリジェントに向けた権利保護を重視した仕組みであり、人間をシステムに組み込み、即時支払いを実現します」と述べています。
Human APIは今後、音声以外の人間提供データ形式や現実世界のタスク実行への拡張を計画しています。現在、同プラットフォームは thehumanapi.com で貢献者登録を受け付けています。