【2025ベストヒット大予想】
生成AIが一般化し、ユーザーがスマホやPCといった“エッジデバイス”で、AIに触れる機会も増えた。しかし、個別のツールへの理解は進む一方で、AIの全体像は霞みがちではないだろうか。一度立ち止まり、その世界観を俯瞰してみよう。
* * *
ひと言で「AI」と括っても、実はその実態はさまざまだ。旧来のAI(識別系AI)は、学習した内容から適切な回答として決められた出力パターンを選択するものだった。一方、昨今トレンドになっている「生成AI」は、AIモデルが学習を重ねた内容をもとに、画像やテキストなどのオリジナルのコンテンツを出力する。象徴的な事例としては、22年8月に「Midjourney(ミッドジャーニー)」が登場し、AIによる画像生成への関心が一気に高まったこと。22年末から23年にかけてOpenAIによる「ChatGPT(チャットジーピーティー)」が流行し、大規模言語モデルを活用した自然言語処理が一般ユーザーが扱えるツールとして落とし込まれ、定着が進んだことなどが記憶に新しい。
さらに、こうした生成AIは、画像、音声、テキストなど異なる情報を関連させて一気に処理できる「マルチモーダルAI」の段階へとすでに進化を遂げている。
ただし、こうした生成AIの現状の仕組みとしては、大量のデータを元に、統計学的に正しいと思える処理をしているに過ぎない。予期せぬ状況や曖昧な指示に対しては対応できないワケだ。人のような自意識や高度な意思決定があるわけではなく、AI開発の文脈では「弱いAI」と括られることがある。
ITライター 井上 晃
スマートフォンやスマートウォッチ、タブレットを軸に、最新ガジェットやITサービスなど取材。Webメディアや雑誌に、記事を寄稿する。普段使いの生成AIは有料の「ChatGPT Plus」
▲画像素材/PIXTA
つまり、もし長期的な進化のロードマップに想いを馳せるならば、この先には「強いAI」なる構想が待ち構える。人間のような汎用的な知能を持った「AGI」(Artificial General Intelligence:人工汎用知能)や、人間を超越した「ASI」(Artificial Superintelligence:人工超知能)などだ。
もちろん、市場にこうした「強いAI」が登場するのはまだしばらく先のことだ。しかし、例えばOpenAIはすでにAGIを実現するまでの5段階のロードマップを描いており、初期の「対話型AI」から「推論型AI」へ。そこからさらに「自立型AI」や「イノベーション型AI」、「組織型AI」という段階を見据えている。
なかでも今注目すべきは自立型AI(エージェンティックAI/AIエージェント)という概念だ。これは状況に応じてデータを収集し、決められた目標を達成するために、自己決定タスクを実行する段階である。人間に近い判断を自動でできるソリューションが生成AIと組み合わされていくことは、次なる進化のステップとして現実的だろう。
また、これらと並行し、ロボティクスのようなハードウェアを組み合わせて現実世界での物理的タスクをこなす「フィジカルAI」という概念も欠かすことのできない視点になるはずだ。
■そもそもAIとは?
Artificial Intelligence(人工知能)の略で、文字通り人工的に作られた知能のこと。その定義はさまざまだが、一般的に「大量の知識やデータの処理などに対して人間が行う知的行動をコンピューターに行わせる技術」を指す。
<AIの進化ロードマップ>
■従来のAI
あらかじめ決められた出力のなかから適切なパターンを選ぶ仕組み。生成系AIと対比して「識別系AI」とも呼ばれる。ほかにも「予測系」「会話系」「実行系」等の分類がある。
▼
■生成AI
ほかの分類と対比して「生成系AI」とも。オリジナルのコンテンツを出力できるのが特徴で、昨今のAIツールのなかでも花形だ。テキストや動画など、得意分野は多岐にわたる。
▼
■マルチモーダル化が進んだ生成AI ※現在はこの段階!
画像を見せると、テキストで返答したり、音声で伝えた指示に対して、楽曲を生成したり——と、複数種類の入出力を複合的に扱える生成AIを「マルチモーダル」だと表現する。
▼
■AGI(Artificial General Intelligence)
人のような汎用性ある知能を持つAIという概念。自ら学習し、意思決定を行い、広い課題に対応する。ここに至るまでには「エージェンティック AI」などの発展がカギになる。
▼
■ASI(Artificial Super Intelligence)
AGIの先にあるとされる“人間の知能を超えたAI”という概念で、「シンギュラリティ(技術的特異点)」とともに語られる。2045年頃に実現すると言われるが、果たして…。
<生成AIの主な出力コンテンツ>
■テキスト(創作・検索・要約・文字起こし)
入力した指示を元に、それに沿ったテキストを生成したり、既にあるテキストの情報を要約したり、校正を行なったりできる。会議の音声から文字起こしをできることもある。
■画像
構成や画風を指定した画像を生成できる。また、既にある写真の被写体のサイズを変えたり、背景を自然に合成しながら被写体の位置をずらす、といった機能も多く存在する。
■動画
テキストで指定した内容を元に動画をゼロから生成したり、静止画を元に動きや奥行きのある映像を生成したりできる。動画中の不要な要素を削除するといった機能などもある。
■音声
テキストを自然な人の声で読み上げられる。既にチャットボットや自動受付、ニュースの読み上げなどに活用されていることも多い。特定の声質を再現させることも可能。
■音楽
指定したテーマなどを元に、複雑な楽曲を生成できる。ジャズのようなBGMを一瞬で生成できるのはもちろん、歌付きのポップスを生成できるツールも多く存在する。
<生成AIツールの一例>
■ChatGPT
誰もが知るOpenAIの生成AIツール。テキスト、画像、音声など、幅広く対応する。
■Copilot
マイクロソフトが展開する生成AI活用のアシスタントツール。Windowsに組み込まれた。
■Gemini
Googleの生成AI。スマホでお馴染みの「Gemini Nano」のほか「Pro」や「Ultra」も。
■Mid journey
代表的な画像生成AIのひとつ。「Discord」上で動くため、同サービスへの登録が必要。
■Sora
ChatGPTと同じOpenAIによる動画生成AIモデル。ゼロからの生成のほか、部分変更も可。
※2025年2月6日発売「GoodsPress」3月号22-23ページの記事をもとに構成しています
<文/井上 晃>
【関連記事】
◆大容量と軽量、2個付属するバッテリーを自分で付け替えられる“AI PC”レッツノート「FV5」シリーズ
◆軽い、タフ、自分でバッテリー交換可!AI活用も簡単なdynabook「X CHANGER」シリーズ
◆14インチ、約1.2kgのASUS「Zenbook S」“Copilot+PC”モデルで生成AIをフル活用
- Original:https://www.goodspress.jp/features/657676/
- Source:&GP
- Author:&GP
Amazonベストセラー
Now loading...