模倣学習が変える、産業現場におけるフィジカルAIのモデル訓練

模倣学習は、産業用ロボットのトレーニング方法を大きく変えつつあります。従来のプログラミング中心の手法から、実環境での相互作用を通じた学習へ――。ユニバーサルロボットのAnders Billesø Beckが、データ品質や力覚、そして生産現場で使えるハードウェアの重要性について解説します。

Using teach pendant with Polyscope X

これまで数十年にわたり、産業用ロボットはプログラミングによって動かされてきました。すべての動作を定義し、あらゆる例外を事前に想定する。この方法は、同じ作業を同じやり方で繰り返す限りにおいては非常に有効です。

しかし、ロボットにより高度な対応――接触やばらつき、不確実性への対応――が求められるようになると、このアプローチは限界を迎えます。これらはルールやスクリプトで記述するのが難しく、経験を通じて学習する必要があります。

そこで重要になるのが「模倣学習」です。

模倣学習とは

模倣学習では、ロボットが人の作業を観察し、それを再現することでタスクを習得します。すべてをプログラムする代わりに、エンジニアがロボットを実際に操作しながら動作を教示し、その際に生成されるデータを収集します。

このデータが、環境を理解し、適応し、動作するAIモデルの学習基盤となります。

ユニバーサルロボットでは、模倣学習をフィジカルAIの中核技術と位置づけ、実際の工場環境で機能するロボット開発において重要な要素としています。

本質的な課題は「データ品質」

現在のAI議論では、基盤モデルやVLAモデル、強化学習といった「モデル」に注目が集まりがちです。しかし実際の進展を左右するのは、それ以上に「データの質」です。

産業用途のタスクでは、複雑で相互に依存した信号が発生します。単なる動作データだけでは不十分で、接触力、コンプライアンス、ツールとの相互作用、視覚情報、作業の微妙な違いといった要素すべてが重要です。

これらの情報が欠落していたり、遅延したり、間接的にしか取得できない場合、どれだけ高度なモデルでも汎用化は困難になります。

模倣学習の価値は、実際の物理的な相互作用に基づいた高精度データを取得できる点にあります。理想的には、「想定された作業」ではなく「実際に行われている作業」をそのままデータ化できます。

ラボ実験から現場へ

現在の模倣学習の多くは、VRコントローラや研究用ロボット、特注の実験装置に依存しています。これらは研究には有効ですが、産業用途への展開には課題があります。

異なるハードウェア間で学習と実行を行うと、摩擦や遅延、予期しない不具合が発生します。力の挙動やダイナミクスが変わり、ラボで成功した手法が現場では通用しないこともあります。

そこでユニバーサルロボットは、NVIDIA GTC 2026において新しいアプローチを発表しました。それは「実際に稼働する産業用ロボットで学習する」という考え方です。

目的はシンプルです。模倣学習を実用化するには、日常的に使われているロボットと同じ環境・条件でデータを取得する必要があります。

UR AI Trainerの紹介

この取り組みを支えるために開発されたのが「UR AI Trainer」です。産業用途に特化した模倣学習システムです。

UR AI Trainerは、リーダー・フォロワー構成のロボットシステムを採用しています。オペレーターが「リーダー」ロボットを直接操作すると、「フォロワー」ロボットがその動きをリアルタイムで再現します。

この過程で、動作、力、トルク、視覚情報が同期された形で自動的に記録されます。

これは単なる研究用プロトタイプではなく、ロボット、計算基盤、センサー、ソフトウェアを統合した、実運用可能なシステムです。

力覚と制御の重要性

UR AI Trainerの中核は、トルクを考慮したリアルタイム制御です。「ダイレクトトルク制御」機能と力覚フィードバックにより、オペレーターは自然でしなやかな動きでロボットを操作できます。

接触は「後から推定するもの」ではなく、「直接取得する信号」として扱われます。どの程度の力が加わっているか、ツールがどのように対象物に作用しているかといった情報が、そのままデータとして記録されます。

多くの産業用途において、この物理的な再現性の高さが、シミュレーションで有望なモデルと、実環境で確実に動作するモデルの差を生みます。

見て、同時に動く

動作や力のデータだけでは不十分です。VLAモデルを学習するには、「認識」と「動作」が密接に結びついている必要があります。

UR AI Trainerでは、複数のカメラによる視覚データを、ロボット状態や力の情報と同期して取得します。これにより、視覚・物理相互作用・動作が一体となったデータセットが生成されます。

結果として、ロボットが現実世界でどのように「見て、判断し、動くか」を忠実に再現した学習データが得られます。

現代のAI開発に適した設計

データ収集は、それ単体では価値を生みません。実際のAI開発フローに統合されて初めて意味を持ちます。

UR AI TrainerはUR AI Accelerator上で動作し、Scale AIのソフトウェアと連携することで、データ収集・構造化・学習準備までを一貫して実行できます。

これにより、デモンストレーションからデータセット生成、モデルのファインチューニングまでをスムーズに進めることができます。

さらに、Ventionと共同開発した量産対応ハードウェアプラットフォームにより、複数ロボット構成でも安定した運用が可能です。

データセットから実運用へ

模倣学習の価値は、その先にあります。高品質なデータセットは、VLAモデルの学習やファインチューニングに活用でき、実環境でのばらつきへの対応力を高め、シミュレーションと実運用のギャップを縮小します。

また、Scale AIやAIモデルパートナーとの連携により、URロボットで収集された産業データがエコシステム全体の発展にも貢献します。

なぜ今重要なのか

模倣学習自体は新しい技術ではありません。しかし、産業レベルで実用化できる環境が整ったことが大きな変化です。

今後、AIがより複雑な物理タスクを担うようになる中で、成功の鍵はモデル設計だけでなく「どのようにデータを作るか」にあります。

模倣学習はその基盤であり、UR AI Trainerのようなシステムが、それを現場で実現可能にします。

Anders Billesø Beck

Anders Billesø Beck

Vice President of Technology, Universal Robots

Anders Billesø Beck leads the development of cobot technologies to keep global businesses agile, productive and innovative. He holds a PhD in robotics from DTU, the Technical University of Denmark, and has also held leading positions at the Danish Technological Institute. Anders combines his scientific background with contributions to the global collaborative automation industry to change the way the world works.