Japanese
Leave Your Message

ジェネレーティブCADが到来、オートデスクは600億ドルを投じて大規模なCADモデルを社内に取り込む

2025年1月20日

CAD 巨大企業オートデスクも、生成型AIを導入しようとしている。
この記事執筆時点で、オートデスク(US:ADSK)の株価は2024年比で20%以上上昇し、1株あたり293.32ドル、時価総額は630億6400万ドルとなっている。
「私たちは、既存のどのモデルとも異なる生成型AIベースモデルを開発しています。」オートデスクのエグゼクティブバイスプレジデント兼最高技術責任者であるラジ・アラス氏は、最近の公開イベントでの発言の中でこのように述べた。ラジ・アラス氏が言及しているベースモデルは、2024年5月に発表された「ベルニーニ」と呼ばれる生成型AIプロジェクトであり、 変換するテキスト、手描きのスケッチなどを3Dファイルに変換する。
現在の大型モデル市場において、グラフ生成による3D機能の実装は、特に目新しいものではないように思われる。Google DeepMindがリリースしたばかりのGenie 2、国内のTencent Hybrid、BioDigital TechnologyのVoxCraftなど、いずれも同様の機能を実装している。しかし、グローバルCAD大手であるAutodeskにとって、Berniniは実際のビジネスにおいて非常に重要な意味を持つ。

ベルニーニの発見
ベルニーニは、17世紀の著名なイタリアの彫刻トップページであり建築トップページでもあるジャン・ロレンツォ・ベルニーニにちなんで名付けられました。トレーニングデータの選択に関しては、オートデスクAIラボが香港中文大学と共同で公開している1,000万個の3D形状データを用いてモデルをトレーニングしました。
ベルニーニが他の基本的な大型模型と異なる理由は、ベルニーニが3D画像を生成する際に3つの主要な特徴を持っているからです。
1. 生成される3D画像の構造は、機能的な3D構造である。例えば、単に似たようなモデルを生成するのではなく、中が空洞で実際に水を保持する機能を果たす水筒を生成する。
2. 形状とテクスチャを分離する。形状とテクスチャを別々に生成できる機能により、ユーザーは変数を調整したり、それらをブレンドしたり、他のデザインを作成したりする自由度が得られ、3D オブジェクトのテクスチャと輪郭が混同される問題を回避できます。
3. 幅広いバリエーションを提供します。プロフェッショナルなジオメトリワークフロー向けに最適化されており、単一の入力から複数の機能的な3D形状バリエーションを生成できるため、デザイナーは選択肢が増え、クリエイティブなワークフローが加速されます。

news-5.jpg

オートデスクのユーザーインターフェースのスクリーンショット

このため、基本モデルは、これらの特性を実現するために、設計および製造プロセスにおける自然な障壁を克服する必要があります。つまり、AIは設計作業の入出力の複雑なロジックに完全に適合する必要があります。「テキスト、スケッチ、ボクセル、点群などのマルチモーダル入力を受け入れることで、これらは作成者の設計プロセスを再現します」とラジ・アラスは説明します。
さらに、3D CADのような形状を生成するには、空間と構造に関する物理法則に基づいた推論が必要となるため、高い精度と正確さが求められる。
つまり、時間的な観点から見ると、ベルニーニのローンチは決して迅速なものではなかったようだ。ベルニーニの進捗状況が明らかになった2024年5月から、ほぼ1年が経過している。当時、ベルニーニはコンセプトビデオの一部を公開しただけだった。そして、CEOのアンドリュー・アナグノストがベルニーニのプレビューを公開したのは、10月にサンディエゴで開催されたオートデスクのユーザーカンファレンスでのことだった。
しかし、アンドリュー・アナグノスト氏は、ベルニーニは公開データで学習されており、まだ商用利用はできないものの、AIコミュニティに公開されていると述べた。ただし、ベルニーニのビジネスプランの可能性については、「ベルニーニの学習方法はデータに依存しないため、必要に応じて顧客は独自のデータを使用してベルニーニを最適化し、モデルを継続的に改善することができる」と明かした。

ベルニーニはいかにして「作られた」のか
ベルニーニのトレーニングプロセスでもNVIDIA GPUが使用されていますが、ラジ・アラス氏は、GPU以外では、モデルのトレーニングにおいて「データ」の処理と利用がより重要だと考えています。講演の中で、ラジ・アラス氏はこのプロセスについてさらに詳しく説明しました。彼女は構築プロセスを、データ処理、データ準備、コストと効率を考慮したモデルトレーニング、そしてモデル推論のための複雑性管理の4つに分けて説明しました。
「数十億ものオブジェクトとペタバイト規模の、サイズ、形状、ワークロードが異なるデータを処理する必要がある」とラジ・アラス氏は述べた。
オートデスクは、膨大な量の大型設計ファイルを基にクラウド上にデータ基盤を構築する必要があり、そのためにAmazon DynamoDBを主要データベースとして選択し、数百のパーティションにわたる書き込みを高スループットかつほぼゼロのレイテンシーで実現する標準的なデータモデルを作成しました。
データパフォーマンスの問題を解決することに加え、Autodeskは、Amazon EMR、Amazon EKS、Amazon Glue、Amazon SageMakerなどのクラウドサービスを組み合わせることで、大量の複雑な履歴データを特徴付け、タグ付け、セグメント化し、基本的なモデルトレーニングのためのデータ準備プロセスを容易に完了させました。
モデルトレーニングの段階では、AutodeskはGPUの選定など多くの問題に直面しましたが、最終的にはAmazon SageMakerを使用して、インスタンステストやインフラストラクチャ管理などのソリューションを統合しました。チームは、データ準備、モデル開発、顧客志向のAI機能開発に重点を置きました。
大規模なモデル推論を管理する際には、レイテンシ、コスト、パフォーマンスを適切に考慮する必要があります。「Amazon SageMakerのオートスケーリングとマルチモデルエンドポイントは、リアルタイム推論とバッチ推論をシームレスにサポートし、高いスループット、最小限のレイテンシ、そして最大限のコスト効率を実現します」とRaji Arasu氏は述べています。
ご覧のとおり、Autodesk の Bernini の構築では、Amazon Cloud Technologies の最も広く知られている AI および機械学習サービスである Amazon SageMaker が多用されています。Autodesk を含む多くの著名な組織が、モデル トレーニングに Amazon SageMaker HyperPod を活用しています。Amazon SageMaker HyperPod は、最近、さまざまなコスト効率の高いコンピューティング リソースを効率的に利用してコストを最適化する、より自動化されたトレーニング ジョブを作成するフレキシブル トレーニング プランや、リソース利用プロセス中にモデルのトレーニング、微調整、推論を最大化するためにさまざまなトレーニング タスクに優先順位を付けるタスク ガバナンスなど、いくつかの重要なアップデートを正式にリリースしました。
これらのイノベーションに基づき、オートデスクは最終的にベースモデルの展開時間を半減させました。これにより、運用コストを安定させながら、AIの生産性を30%向上させることができました。ラジ・アラス氏はまた、オートデスクがこれらのベースモデルに基づいて構築されたAI機能を顧客向けに展開し始めたことも明らかにしました。
「お客様のデザインパートナーとして、材料強度やコストといった要素のバランスを取りながら、最適なデザインを決定できるようサポートします。これはすべて、面倒な作業を最小限に抑え、創造性を最大限に引き出すためです」とラジ・アラス氏は語った。

正しいデータ、大規模モデルのトレーニングの前提条件
ChatGPT以降、NVIDIAのGPUは大手AI企業がこぞって狙う人気ターゲットとなり、大手企業が1年間にどれだけのNVIDIA GPUを発注するかは、メディアのトップニュースになるほどだ。しかし、ベルニーニの誕生過程を総括すると、GPUはもちろん重要だが、大規模モデルのトレーニング品質を決定づけるのはデータである。
そして、ビジネスで実際に機能する大規模なモデルを訓練することは、多くの側面を含むフルスタックシステムの問題です。
「大規模モデルは、生成型AIアプリケーションのイノベーションの一部分に過ぎません。生成型AIアプリケーションのイノベーションを成功させるには、他にも強化すべき機能があります。まず何よりも、生成型AIが、組織自身のデータを用いて生成型AIアプリケーションの大規模モデル機能を強化できることを確認する必要があります。」アマゾンのグローバルバイスプレジデント兼アマゾンクラウドテクノロジーグレーターチャイナ社長のルイソン・チュー氏は、講演の中で同様の見解を表明しました。
現在、大規模モデルにとって大きな懸念事項となっている錯覚問題については、「メタデータ」の観点からも解決できます。これは、大規模モデルのトレーニング前に知識ベース内のデータの品質を確保することです。「データベース内のメタデータ、つまりレビューされ承認された高品質のデータは、レイテンシを削減し、大規模モデルの応答性を向上させるのに役立ちます。」Amazon Cloud Technologiesのテクノロジー担当副社長であるMai-Lan Tomsen Bukovec氏は、大規模モデルをトレーニングしている組織に対し、人間が作成したデータとAIが生成したデータを区別するよう注意を促しました。
データの重要性から、ビッグモデルは企業がデータ資産を実現する方法を加速させています。2か月前、中国の3D空間デザインプラットフォームであるCool Spacesの親会社であるQunar Technologyも、身体化知能などのためのデータトレーニングプラットフォームを立ち上げ、世界最大の屋内シーン認識ディープラーニングデータセットを公開するという新しいビジネスプランを発表しました。同社は、このプラットフォームにはすでに3億2000万を超える3Dモデルがあり、月間平均7780万人のアクティブビジターがいることを明らかにしました。同社は、AIGC、身体化知能、AR/VRなどの企業向けに、物理的に正確な3D空間データ資産、空間認識ソリューション、空間知能トレーニング関連サービスを公開する予定です。
データによると、企業の約77%が3年以内にAIおよび新興技術への投資を増やすか大幅に増やす予定であり、AIによって効率化が最初に実現する3つの分野は、自動化、分析、および拡張(自動化、データ分析、および支援による拡張)である。
「AIがあらゆる産業を変革している」はもはやスローガンではない。「生成AI分野ではますます多くの産業が活発化している」と、Amazon Cloud Technologiesのグローバルサービス担当副社長であるUwem Ukpon氏は述べ、生成AIの産業応用分野は、当初の金融業界から、公共部門、伝統的な産業、政府機関、ライフサイエンスやヘルスケアなどの産業を含む幅広い産業へと徐々に拡大してきたと語った。同時に、生成AIは企業に新たなビジネスチャンスも提供しており、Autodeskは将来の市場として、大規模データに基づく生成CADに賭けている。