企業は大量の非構造化データを保有しているが、そのデータから多くのことを得ることはできていない。
例えば、保有しているデータに対して「ABC社が当社と初めて契約したのはいつ?」とか「青い空が映っているビデオを探して」といった質問を、実際にできるようになることを想像してみて欲しい。
それこそが、SeMI Technologies(セミ・テクノロジーズ)が開発しているベクター検索エンジンWeaviate(ウィビエイト)だ。SeMIの共同創業者でCEOのBob van Luijt(ボブ・ファン・ラウト)氏によれば、それはエンベッディングとも呼ばれる、ベクトルを出力する機械学習モデルを用いたユニークなタイプのAIファーストデータベースであり、それゆえにベクトル検索エンジンと名付けられたのだという。
彼によれば、ベクトル検索エンジンは新しいものではなく、ベクトル検索エンジンの上に構築されたソリューションの例としてGoogle Search(グーグルサーチ)があることを説明した。しかし、SeMIはこの技術のコモディティ化を目標としており、誰でも使えるようにオープンソースのビジネスモデルを採用している。
ファン・ラウト氏は2021年、私の同僚であるAlex Wilhelm(アレックス・ビルヘルム)記者に、2021年のTechcrunchの記事に対して質問応答を行えるセマンティック検索エンジンを示しながら、その技術の詳細を紹介している。
関連記事:ビッグニュースに関するささやかなメモ
「誰もがこの技術を使うことができますし、それを必要とする企業のためのツールやサービスも用意しています」とファン・ラウト氏は付け加えた。「私たちは実際のモデルを作成したり配布したりはしません。それはHuggingface(ハギングフェイス)やOpenAI(オープンAI)のような企業が行っていることですし、企業自身がモデルを作成していることもあります。しかし、モデルを持っていることと、検索やレコメンデーションシステムを実際に稼働させるためにそれらを使うことは別のことです。Weaviateが解決するのはまさにその部分なのです」。
2019年にCTOのEtienne Dilocker(エティエンヌ・ディロッカー)氏ならびにCOOのMicha Verhagen(マイカ・バーハゲン)氏とともに会社を創業して以来、ファン・ラウト氏は、SeMIの技術がKeenious(キーニアス)やZencastr(ゼンキャスター)のようなスタートアップを含む100以上のユースケースに影響を与え、ベクトル検索エンジンが与える新しい可能性に基づいて新しいビジネスを創造し、Weaviateによって提供された結果がたとえば医療分野で人々を直接助ける場面で利用されているのを眺めてきた。
ファン・ラウト氏が個人的に気に入っているのは、より「難解」なものだ。例えばヒトゲノムをベクトル化して検索したり、全世界をベクトルでマッピングしたり、Weaviateを使って簡単に検索できるいわゆるグラフエンベディングと呼ばれるものだ。Meta Researches(メタ・リサーチ)のグラフエンベディング上にSeMIが作成したデモがその例だ。
SeMIは、2020年8月にZetta Venture PartnersとING Venturesから120万ドル(約1億4000万円)のシード資金を調達し、それ以降VCの目に留まるようになった。以来、同社のソフトウェアは75万回近くダウンロードされており、その数は毎月約30%増加している。ファン・ラウト氏は、同社の成長指標の具体的な内容については言及しなかったが、ダウンロード数は企業向けライセンスやマネージドサービスの売上と相関関係があると述べている。また、Weaviateの利用者が急増し、付加価値が理解されたことで、すべての成長指標が上昇し、シード資金を使い果たすことになった。
だがシード資金はなくなったものの、会社は新たな資金調達には積極的ではなかった。しかし、SeMIの共同創業者たちが、元Datarobotの創業者たちが設立したCortical Venturesや、New Enterprise Associates(NEA)と会談をした際に、両社が自分たちの事業をどのように支援できるかを示してくれたのだとファン・ラウト氏はいう。
「まさに『ふいを突いてびっくりさせる』ような凄さでした」と彼は付け加えた。「過去に彼らが行ってきたこと、そして私たちをサポートしてくれているチームは、まさに私たちが求めていたもので、私にとっては初めての経験ではありますが、すべての驚くべき話が真実であると言えます」。
そうした会談の結果、NEAとCorticalがともに主導したシリーズAにつながり、このたび1600万ドル(約18億4000万円)の新規資金が調達された。
SeMIは今回の資金をアメリカとヨーロッパの人材採用に投入し、Weaviateとベクトル検索全般のためにオープンソースのコミュニティを強化しようとしている。また、オープンソースのコアを中心とした市場進出戦略や製品への取り組みを強化するとともに、機械学習がコンピュータサイエンスと重なる部分の研究にも第一歩を踏み出す。
一方、ファン・ラウト氏は、データベース技術の次の波を見ている。彼はデータベース技術はOracle(オラクル)やMicrosoft(マイクロソフト)のような大成功をもたらしたSQLの波から始まり、MongoDB(モンゴDB)やRedis(レディス)のような成功を収めた非SQLデータベースが第2の波だったと考えている。
「私たちは今、新世代のデータベース、つまりAIファーストのデータベースの入り口に立っています。Weaviateはその一例です」と付け加えた。「Weaviateだけでなく、ベクトル検索データベース、あるいはAIファーストのデータベースを市場を啓蒙していく必要があります。機械学習が新たにもたらすすばらしい可能性に、興奮を押さえられません。例えば何百万、いや何十億ものドキュメントに対して自然言語で質問してデータベースに答えさせたり、何百万もの写真やビデオに含まれている内容を『理解』させたりするのです」。
[原文へ]
(文:Christine Hall、翻訳:sako)
- Original:https://jp.techcrunch.com/2022/02/24/2022-02-22-semi-technologies-search-engine-data/
- Source:TechCrunch Japan
- Author:Christine Hall,sako
Amazonベストセラー
Now loading...