公開日
この記事をシェアする
人工知能は赤ちゃんのように言語を学習できるのでしょうか?研究者らは、子供の生活の映像を記録し、AI システムに入力することでこれをテストしました。
人工知能 (AI) システムを赤ちゃんと同じペースでトレーニングするとどうなるでしょうか?
ニューヨーク大学(NYU)の研究チームは、赤ちゃんにヘッドマウントカメラを装着し、生後6か月から2歳の誕生日までのビデオを記録した。
彼らは子どもの起床時間の約1パーセントを記録することに成功し、それをAIシステムやニューラルネットワーク(入力データからパターンを学習できる計算モデル)のトレーニングに使用した。
彼らは研究結果を雑誌に発表しました科学。
AI のトレーニングに使用される通常の大規模なデータセットと比較すると、このデータ量は比較的少ないにもかかわらず、言語学習には十分でした。
「私たちは、一人の子供からの発達上現実的な入力に基づいて訓練されたニューラルネットワークが、単語を視覚的な対応物と結び付けることを学習できることを初めて示しました」とニューヨーク大学データサイエンスセンターの研究科学者であり、この論文の著者であるワイ・キーン・ヴォングは述べています。最初の著者、声明で述べた。
「私たちの結果は、最近のアルゴリズムの進歩と一人の子供の自然な経験が、初期の言語と概念の獲得についての私たちの理解をどのように再構築する可能性があるかを示しています」と彼は付け加えた。
語学学習についてもっと知るためのツール
最上位の AI システムは数兆の単語を含むテキスト データセットでトレーニングを受けますが、子供たちは年間わずか数百万の単語しか触れません。
言語学習の研究に AI モデルを使用することで、「子供たちが言葉を学ぶのにどのような要素が必要か、言語固有の偏見、生来の知識、それとも学習を進めるのに単なる連想学習が必要なのかについての古典的な議論に取り組むことができます」とブレンデン・レイク助教授は述べた。ニューヨーク大学の教授であり、この論文の上級著者でもあります。
研究者らは、約 250,000 語の会話を含む 60 時間の映像を収集しました。
これらの言葉は、食事中、本を読んでいる、遊びの時間などの活動中にその言葉が話されたときに子供が見たものをキャプチャしたビデオフレームと関連付けられていました。
研究者らは次に 2 つのモジュールを使用しました。1 つはビデオ フレーム用で、もう 1 つは子供に向けられた音声の文字起こし用です。
これらは、視覚的手がかりと言語的手がかりの間の関連性を理解するためにモデルをトレーニングするために使用される機械学習の一種である、対照学習で結合およびトレーニングされました。
研究者らの次のステップは、赤ちゃんの単語学習を測定するのと同じ方法で、対照学習モデル (CVCL) に対する子供の視点と呼ばれるモデルをテストすることでした。
彼らはモデルに単語と 4 枚の写真を見せ、その単語と一致する写真を選ぶように求めました。
その結果、モデルは子供の日常生活から多くの単語を学習したことが明らかになりました。
このシステムは、トレーニング中には見られなかったさまざまな画像にいくつかの単語を適用することもでき、子供たちはそれを学ぶこともできます。
「これらの発見は、ニューラルネットワークに見られるような比較的一般的な学習メカニズムを使用しながら、子供たちが受け取る一種の自然主義的なデータから単語学習のこの側面が実現可能であることを示唆しています」とレイク氏は述べた。