運動運動のためのトレーニングロボット
ロボットはアスリートのように動くことができますか?新しいトレーニングモデルは、スポーツの動きを複製するのに役立ちますが、結果は進行状況と予期しない課題の両方を示しています。
カーネギーメロン大学のAIおよびロボット研究者のチームは、Nvidiaの2人の同僚とともに、人間のアスリートのように動くためのロボットを訓練するための新しいモデルを作成しました。チームは、ほとんどのロボットトレーニングが移動に焦点を当てており、流動性や運動能力がないが効率的に移動するロボットにつながることを観察しました。これに対処するために、彼らは全身トレーニングを探求しました。彼らは、既存のモデルには適応性がないことを発見し、あまりにも多くのパラメーターに依存しており、ロボットの動きが過度に慎重になっています。これにより、彼らは新しい2段階のトレーニングフレームワークを開発することになりました。
最初の段階では、AIモジュールをトレーニングして全身の人間のモーションビデオを分析し、モーショントラッキングを使用してロボットの機能に適合するように重要な動きを調整します。第2段階は、ビデオでの人間の動きとロボットが物理的にどのように移動するかの間のギャップを埋めるために、実世界のデータを収集します。このプロセスは、シミュレーションと実際の物理学(ASAP)の調整と呼ばれるフレームワークにつながりました。
ASAPフレームワークは4つのステップで構成されています。第一に、モーショントラッキングプリトレーニングおよび実際の軌跡コレクションには、ヒューマノイド動画のリターゲティングが含まれます。複数のモーショントラッキングポリシーは、実際の動きの軌跡を生成するために事前に訓練されています。次に、デルタアクションモデルトレーニングは、実際のロールアウトデータを使用して実行されます。このステップにより、シミュレートされた状態と実際の現実世界の状態との間の矛盾が最小限に抑えられ、モデルの精度が向上します。
ポリシーの微調整段階では、デルタアクションモデルが凍結され、シミュレータに統合され、実際の物理学とより適切に整合しています。事前に訓練されたモーショントラッキングポリシーは、より正確に微調整されます。最後に、実際の展開では、微調整されたポリシーは、デルタアクションモデルに依存することなく、現実の世界に直接実装され、ロボットが訓練された動きを個別に実行できるようにします。
フレームワークをテストするために、研究者は象徴的なスポーツの動きを複製するためにロボットを訓練しました。Kobe BryantのFadeaway Jump Shot、Lebron Jamesのサイレンサーの動き、Cristiano RonaldoのSiu Leapを空中スピンで演奏しました。各動きが記録されました。
ロボットの動きは明らかに有名なスポーツの動きに似ており、全身の動きの進歩を強調しています。ただし、ロボットがプロのアスリートと間違えられる前に、さらに多くの作業が必要であることも明らかです。