トップ >
テクノロジー > IT・科学 > LGの次世代AI「EXAONE」 文章認識し7分で256枚の絵を描く
「童話の挿絵スタイルの絵を描いて」
LG AI研究院のキム・スンファンビジョンラボ長の指示が下されるとLGが開発した超巨大人工知能(AI)「EXAONE」が動き始めた。命令どおり挿絵創作物数百枚を瞬く間に描いた。次にEXAONEに写真をアップロードすると、写真の説明を自動的に付け始めた。
21日(現地時間)、米国ニューオーリンズにあるモリアルコンベンションセンターで開かれた「国際コンピュータビジョンおよびパターン認識学術大会(CVPR)2022」でLGが次世代人工知能技術を公開した。テキストとイメージが双方向に自由に変換されるLGの人工知能は、3000億個の媒介変数(パラメータ)で訓練させ注目を浴びた。
世界的な人工知能研究団体であるオープンAIの人工知能であるGPT-3のパラメータが1750億個であることを考慮するとデータが約70%さらに多い。キム・スンファンビジョンラボ長は「テキストとイメージを双方向に転換できるようにしたのはLGが初めて」とし「人間と競争する人工知能ではなく人間に助けを与えインスピレーションを与える人工知能を開発することが研究院の目標」と説明した。
EXAONEは文章を入力すれば7分で256枚の絵を描き出し、絵をアップロードすれば英単語基準で最大64単語に達する説明を自動的に付ける。特にオープンAIが昨年公開したイメージ生成人工知能「DALL-E(ダリ)」が縦横1024画素まで絵を描くことができるのに比べ、エクサウォンはその2倍である2048画素までイメージを生成することができる。
LGはこのような技術力を土台に今年初め、パク・ユンヒデザイナーと協業しニューヨークファッションウィークでエクサウォンがデザインした衣装を大挙披露した。エクサウォンがLGを象徴する金星に咲いた花をテーマに約3000枚に達するデザインをパクデザイナーに提供し、彼はこの中から約200枚を選んで整え衣装を完成させた。通常、ファッションショーに使用するデザインは仕上げ作業まで4か月かかるが、EXAONEを通じて1か月半に期間を短縮した。
LG AI研究院はこのために文章の中の単語から脈絡と意味を学習する神経網「トランスフォーマーモデル」を開発し、白紙状態から数百段階にわたり絵を完成させていく「ディフュージョンモデル」も開発中だ。また、研究院は自然語処理、コンピュータービジョン、サービス部門まで人工知能全般を研究している。特にテキスト、イメージ、音声、触覚が互いに自由に変換される、いわゆる多重感覚モデル「マルチモーダル」に集中している。
人工知能アーティスト「Tilda」にEXAONEを融合させるというビッグピクチャーも描いている。これを通じて人工知能アーティストと対話を交わしながらリアルタイムでサービスを提供する方針だ。
LGは「自ら学習するEXAONEは人工知能が各分野の専門家になれる可能性を開いた」とし「今後、専門家の手が必要な創作、化学、製造、金融のような各種分野で人々の仕事を減らす人工知能に生まれ変わるようにする」と伝えた。
LGは今回の学術大会で計7編に達する論文を発表した。LG電子、LGディスプレー、LGエネルギーソリューション、LGユープラス、LG CNSなど主要系列会社5社と共に人工知能優秀人材迎え入れのためのネットワーキングイベントも開いた。