米国オレゴン州ポートランドを拠点とするthatDot(ザットドット)は、イベントのストリーミング処理を専門とするスタートアップ企業だ。同社は米国時間2月23日、データエンジニアのための新しいMITライセンスに基づくオープンソースプロジェクト「Quine(クワイン)」の立ち上げを発表した。これはイベントストリーミングとグラフデータを組み合わせ、同社が「ストリーミンググラフ」と呼ぶものを作成する。
そう聞くと、複雑なものだと思われるかもしれない。それは確かにその通りであり、また比較的新しいコンセプトでもあるからだ。Quineの背景にあるアイデアは、DARPA(米国防総省)の支援を受けた長年の研究に基づき、大容量のデータストリームを、ステートフルなグラフ、すなわち処理状態を把握するためのグラフとして構築するというものだ。論理学者のWillard Van Orman Quine(ウィラード・ヴァン・オーマン・クワイン)にちなんで名付けられたQuineは、チームが「スタンディング・クエリ」と呼ぶものを使って、このグラフにクエリを実行する。基本的には入力されたデータをリアルタイムで計算し、それをQuineが他のアプリケーションに配信する。
「私たちは、現在の業界が抱える問題、つまり私たちが置かれている板挟みの状況に焦点を当てて、ストリーミンググラフを開発しました」と、Quineの生みの親であり、thatDot社のCEO兼共同設立者であるRyan Wright(ライアン・ライト)氏は筆者に語った。「一方では、膨大な量のデータがあります。この10年間、ビッグデータは当たり前のものとなり、ますます大きくなっています。しかし、その一方で、我々はこれらのデータをどのように解釈すればよいのでしょうか?」。
最近ではかつて以上に、そのデータが動いており、多くの作業負荷ではレイテンシー(遅延時間)が重要になる。オープンソースのイベントストリーミングプラットフォームであるApache Kafka(アパッチ・カフカ)と、そのストリーミングデータを分析するApache Fink(アパッチ・フィンク)を組み合わせたような既存のソリューションでは、企業はデータプラットフォームとパイプラインを構築してこれらの入力データをすべて分析するために、何十人ものエンジニアを割かなければならないと、ライト氏は主張する。他の現代的なアプローチとしては、Neo4j(ネオフォージェイ)とTigerGraph(タイガーグラフ)のようなツールがあり、開発者の間にグラフデータベースを普及させてきたが、これらのツールはいずれもデータベースの観点からこの問題にアプローチするものだと、ライト氏は主張する。
「このような考え方では、技術的な詳細や、高速化、簡単化、拡張化の難しさなど、旧来の問題に悩まされることになります。そのため、この業界では大量のデータが入ってきても、速度が遅すぎてグラフソリューションをきちんと検討できないということがよく起こるのです」と、ライト氏はいう。同氏の主張によれば、現在のほとんどのソリューションは、1秒間に数千件のイベントを処理できる程度だが、Dot社が対象としているような顧客は、1秒間に25万件のイベントを処理できるソリューションを必要としているという。ライト氏は、Quineがそれに応えられる、あるいはそれ以上の処理能力を持っていると確信している。
「私はQuineを使用することによって、複雑なカスタムロジックとSQLクエリのページを、基礎となるイベントが変更されるたびに更新されるストリーム計算されたロールアップ値へのシンプルなクエリに置き換えることができました」と、Tripwire(トリップワイア)社の上級エンジニアであるMatt Splett(マット・スプレット)氏は語る。
同社のユーザーは、セキュリティ企業、オブザーバビリティ企業、ログ処理企業、フィンテック企業、広告企業、不正検知企業など、多岐にわたると、ライト氏と彼の共同設立者でCOOのRob Malnati(ロブ・マルナティ)氏は指摘する。他のオープンソース企業と同様、thatDotの使命は、膨大なQuineの企業ユーザーをサポートすることだが、同社はQuineをプラットフォームとして利用し、その上に新しいソリューションを構築することにも取り組んでいる。
同社は2020年に、Oregon Venture Fund(オレゴン・ベンチャー・ファンド)の主導で200万ドル(約2億3000万円)を超えるシード資金を調達しており、2022年後半にはシリーズAラウンドの資金調達を見込んでいる。
画像クレジット:KTSDESIGN/SCIENCE PHOTO LIBRARY / Getty Images
[原文へ]
(文:Frederic Lardinois、翻訳:Hirokazu Kusakabe)