MAIL MAGAZINE

下記からメールアドレスを登録すると、FUZEが配信する最新情報が載ったメールマガジンを受け取ることができます。


機械翻訳の未来:気鋭の研究者が語る、AIの言語感覚スパイラル

DIGITAL CULTURE
ライター福田ミホ
  • はてなブックマーク

人工知能技術がめざましく発達し、それを活用したさまざまなアプリケーションが実生活で使われはじめている。なかでも機械翻訳、特にGoogle翻訳のディープラーニングによる精度向上ぶりは多くの人を驚かせ、いつか人間による翻訳行為は不要になるのではないかという見解すら提示されつつある。

いっぽう、機械翻訳の限界を指摘する議論もあり、少なくとも現段階ではGoogle翻訳だけであらゆる文章を適切に訳せるわけでもない。FUZEでも一般論としても、「機械翻訳に適しているのは行政書類のように定型的なもの、適さないのは会話や文学作品など非定型なもの」といわれている。筆者は現在アメリカに住んでおり、日常会話も定型的なやりとりで済むものが多く感じているが、今後会話ベースの翻訳が容易になることはあるのだろうか。また、翻訳を前提としたテキストはより訳しやすい形で書くように変わりつつあるともいわれている。「定型的」なテキストの機械翻訳への委託は、技術の進歩や機械翻訳の普及とともに広がっていくのだろうか。

今回、日本における機械翻訳研究の第一人者である独立行政法人科学技術振興機構の研究員である中澤敏明氏にインタビューを行ない、近い将来機械翻訳がどこまでいけるのか、人間による翻訳が不要になる日は来るのかについて話を聞いた。

なお、この記事はFUZEで以前取りあげた以下の記事に基づいて作られている。

関連記事
「他言語を学ばなくてもいい日」は来ない。言語と機械翻訳を改めて考えてみる | 人間編|abcxyz - FUZE
「他言語を学ばなくてもいい日」は来ない。言語と機械翻訳を改めて考えてみる | アルゴリズム編|abcxyz - FUZE

* * *

──近い将来「定型的」なテキストならば機械翻訳が人間と遜色ない精度になるとして、一般的に接するテキストの何%くらいが機械翻訳によってカバーされるでしょうか?

中澤敏明(以下、中澤):何%がカバーされるかについては、明確な答えは持っていません。テキストにもさまざまな種類があり、大きくわけると次の3タイプがあると思います。

1. ニュース記事、広告、注意書き、特許文書、論文など必要な情報を通知するためのもの
2. 2chなどのネット掲示板やSNS、チャットのようにコミュニケーションを前提とするもの
3. 文学作品などのように受け取り手によって解釈が変わるようなもの

このうち、「定型的」といわれるものは1.に当たると思います。SNSもやらないし小説も読まないような人なら100%カバーされるといってもいいでしょうし、逆に一日中掲示板やSNSに張りついているような人、映画や小説好きの人はほとんどカバーされないかもしれません。

先日の記事でも触れられていましたが、要約をするだけなら2.もある程度カバーできると思います。ただ、この場合翻訳の技術というよりは、各言語での要約の技術もしくは各言語を理解する技術が必要となります。入力されたものに近い文の翻訳を提示する技術はかなり昔からありましたが、利用範囲はごく短く、単純な文に限られていました。今後、言語理解の技術が高度化されれば、長く複雑な文であっても要約して翻訳することや、意味的に同じ文の翻訳を提示することは可能になると思います。

──コンピュータによる言語理解について、たとえば先日の記事に例として挙がっている「やっと来た! 数カ月待ったけど新しい炊飯器が着いた! :) 美味しいご飯ができるといいね! xD 」というテキストは「話者が数カ月の待機の後に炊飯器を入手した」という意図であるとか、この場合の「ご飯」は米飯であって「食事全般」ではないとか、そういった正確な情報をコンピュータは適切に把握できているのでしょうか? 機械翻訳システムは、そういったことを理解して翻訳結果を出しているわけではないんですね。

中澤:言語理解についてはおっしゃるとおりです。文の表層的な情報だけでなく、前後の文脈や一般常識、ときには空間的な情報なども考慮して本当に伝えたい情報をコンピュータが理解することが目標になります。これが実現できると、人間とコンピュータやロボットがスムーズにコミュニケーションをとることが可能になります。

現在のニューラル機械翻訳(Neural Machine Translation、NMT)と呼ばれる手法は、入力された文を何かしらの中間的な表現(実際はベクトルや行列などで表現された数値)に変換してから翻訳するため、大ざっぱにいうと言語理解を元に翻訳を行なっているといえなくもありません。しかしこの中間的な表現にどのような情報が含まれているかを知ることができないため、入力文が伝えたいことを理解できているとは自信を持っていえません。

機械翻訳が考える「正しい翻訳」

──10年後とか20年後、機械翻訳ではどの程度の非定型性が許容されるのでしょうか? 「技術系マニュアル→ 新聞記事→ Twitterなどのポスト→ 友だち同士の会話」の順に定型から非定型になるとして、10年後にはどのあたりまでが機械翻訳で人間と同程度の精度になるでしょうか?

中澤現時点でも技術系マニュアルの翻訳は高精度に行なうことができますし、実用化されています。

いっぽう、新聞記事に関しては少しややこしい問題があります。同じ内容の日本語の記事と英語の記事を見比べてみるとわかりますが、必ずしも翻訳が1対1で対応しているわけではありません。これは一度ほかの言語に訳してから、読みやすいように翻訳先言語のネイティブがリライトを繰り返すからです。このとき文の順序や情報の提示の順序が変わるため、記事全体の構造が大きく変わります。

──たしかに、筆者自身翻訳の仕事もしていますが、かならず大まかに訳してから日本語としてより自然な文章に直すプロセスを踏んでいます。たとえば、「I finally received a rice cooker that I had bought several months before.」という文があったとすると、直訳は「私は数カ月前に買った炊飯器をついに受け取った」となりますが、場合によっては「私はついに炊飯器を受け取った。それは数カ月前に買ったものだった。」と文を切ったり、「私は数カ月前炊飯器を買ったのだが、ついにそれを受け取った」と順序を入れ替えたり、「私が炊飯器を買ったときは数カ月待ちだった」と全然違う構造にしたりしています。

中澤:本として出版するレベルでの翻訳表現にこだわるとすれば、それを機械で代替するのは10年後でも難しいでしょうが、直訳するだけなら10年も経たずにできると思います。Twitterの翻訳は、機械翻訳での言語理解がどこまで進むかにもよりますが、10年経てば相当可能になるのではないかと思います。すでにFacebookやAmazonなどは自前の機械翻訳エンジンを用意してSNSや口コミの翻訳を行なっています。

友達同士の会話の翻訳は、テキストに書きおこすかどうかで難易度が変わると思います。テキストに書き起こすならば、Twitterの翻訳と同じぐらいにはできると思います。ただ、会話の流れを考慮する必要があるなど、Twitterの翻訳より少し難しい点があります。音声をそのまま翻訳する場合は、音声認識技術なども必要になってくるためさらに難しくなりますが、MicrosoftがSkype翻訳サービスを出しているなど、音声翻訳の技術も向上しているため、10年経てばかなりの精度になる可能性が高いのではないでしょうか。

機械翻訳が代替できる文章スタイル

──とはいえ、10年後も実際の利用シーン、たとえばGoogle翻訳のユーザーは翻訳結果が完全に正しいかどうか確信がない状態ではないでしょうか。であれば、Google翻訳で訳しやすい原文をサジェストする機能をつけるとか、応用側も進化していくといいのですが、そのような動きはありますか?

中澤:まずサジェスト機能についてですが、実は難しい問題です。翻訳エンジンが訳しやすいと判断することは確率などを元にして行なうことが可能ですが、訳しやすさと翻訳の正確性は必ずしも相関しません。翻訳エンジンは出力した訳が正しいかどうかを判断することができません。これができるなら、常に正しい翻訳が出せることになりますので。訳しやすさを翻訳の確信度(正確性ではない)としてとらえることはできますので、この確信度をユーザーに提示することは今でも可能です。ですが、ユーザーに誤解を与えるためどのサービスでもそのような指標は提示していないのだと思います。

また出力した翻訳の正確性を推定する研究も「quality estimation」という分野として数多くなされていますが、まだ研究段階という感じです。

ご指摘のように翻訳しやすいような書き方に統一するという動きもありはしますが、すべての人にルールを遵守させることは不可能といってよく、うまくいく保証はありません。もちろん「医療関係」とか「法務関係」とか、カテゴリを限れば可能かもしれませんが。

Google翻訳をどう使うか、どのような入力文を入れたら正しい翻訳が出やすいかといったノウハウを蓄積している会社もあります。旧Google翻訳ではこれらのノウハウが役に立ったのですが、新しいGoogle翻訳においてはこれらのノウハウがほぼ使えない状態になっています。今後、ノウハウが蓄積される可能性はありますが、すぐにとはいかないと思います。

──逆に、50年、100年後も人間がしなくてはならない翻訳作業があるとすればどのようなものですか?

中澤:まず文化が絡むようなものは機械的な翻訳は難しいのではないかと思います。

Lost in Translation』という本があって、いろいろな言語特有の、ほかの言語に訳すことが不可能な概念を表す言葉を集めています。たとえば日本語では「わびさび」などが収録されています。

また料理のレシピを翻訳する場合に、料理名や食材などは、そのまま翻訳しても結局意味がわからないことになります。この場合は翻訳というよりは、説明をする必要があるため、人間の手が必要なのではないかと思います。

逆に、どの言語でも共通の概念で言い表せるような内容の翻訳は、ほぼ自動化できるでしょう。

気鋭の研究者に機械翻訳の未来を問う。人間とAIの言語感覚スパイラル

機械翻訳の発展には何が必要か

──機械翻訳の完成度を高めるために現在ボトルネックとなっているものはありますか?

中澤:ニューラル機械翻訳に話を限定すれば、最大のネックは機械翻訳エンジンがなぜこのような訳を出したのか説明できない点にあると思います。これは実用と研究開発の両方において問題です。

実用の面では、ざっと内容を把握するためだけなら翻訳の根拠まで提示する必要はないと思います。ただ機械翻訳を下訳(翻訳のベースとなる大まかな訳)として使って翻訳表現を練る必要がある場合などは、機械翻訳が誤っているかどうかをチェックする必要があり、翻訳の根拠が示されないと結局すべてをチェックしなければならず、効率化が難しくなります。

研究開発での問題は、機械翻訳結果が誤っていたとしてもどこをどう直せば改善するのかが自明ではないことです。以前の翻訳手法(ルールベースや統計ベース)ではある程度改善の目処を立てることができたのですが、ニューラル翻訳では困難になっています。

これに関連して、今Google翻訳にも使われているニューラル翻訳は、翻訳をコントロールすることがほぼ不可能なのも問題です。たとえばある文をGoogle翻訳で訳したとき、句読点を追加しただけで翻訳内容が大きく変わってしまったりします。この変化には規則性はなく、いい翻訳を出すには入力文を試行錯誤する必要があります。これは上記のGoogle翻訳をうまく使うためのノウハウを溜めにくい大きな要因です。

ただこれらのことは実は機械翻訳に限らず、現在の人工知能と呼ばれる技術の多くが抱える問題でもあります。たとえば有名なAlphaGoや将棋の電脳戦などはたしかに人間よりも強いことは事実だと思いますが、ある時点でのコンピュータの手を人間はもちろん、コンピューター自身も人間にわかるようには説明できません。人工知能研究全体として、「説明可能なAI」が求められています

人間と機械、言語の未来予想図

──上の記事に「人間の脳を再現し、思考できる汎用人工知能が完成すれば、人間と同レベルかそれ以上の翻訳ができる」というくだりがあります。ただし、そこまで高度化すると、人間と同じように仕事を拒否したり、嘘をついたりする可能性もあるとされています。そういったことは考えられるでしょうか?

中澤技術的特異点、またはシンギュラリティという言葉がありますが、ご質問の答えの一つはこのシンギュラリティに相当すると思います。シンギュラリティに到達すると人工知能が人間の能力を超え、人間が人工知能に支配される、といったことが起こると予想されています。そうなるとたしかに記事で書かれているようなことが起こるかもしれませんが、それ以上に、これまで人間が使っていた言語は撲滅され、人工知能が作り出した新たな言語を世界中の人が共通で使うことを強要されるといったことが起こるかもしれません。そうなるとそもそも翻訳という行為が不要になりますね。

関連記事
2017年へ:「幼年期は終わる。今こそバベルの塔を建てよう」(前編)|落合陽一 - FUZE

──今人工知能を開発されている第一線の研究者にとって、シンギュラリティはあるとしてもまだまだ遠い先のSFレベルの話であり普段意識されることはほとんどないのでしょうか?

中澤:私自身、意識することはないですし、多くの研究者も普段から意識しているということはないのではないでしょうか。酒の肴的に話題に出ることはありますが。人工知能が進化するいっぽうで、それらをどう使うかといった倫理指針を検討するグループもあります。1990年代後半にクローン羊が生まれたときには世界中で話題となりましたが、このときもさまざまな議論が巻き起こりました。技術的に可能であることと、実現することは別と考えるほうがいいと思います。

──ほかに機械翻訳をめぐる一般の議論で気になる点、知っておいてほしい点などあれば教えてください。

中澤:機械翻訳技術が向上することは、社会のさまざまな場面で非常に有益であることは間違いないのですが、つねに完ぺきな翻訳が出せることは絶対にないということを認識したうえで使ってもらう必要があると思います。

逆説的ですが、高精度な機械翻訳の誤りに気づくためには、人間もその機械翻訳と同等以上の翻訳能力が必要になります。今後は機械翻訳を使うことで、みずからの言語能力を向上させることができるようになるかもしれません。これはまさに囲碁や将棋の世界で起こっていることと同じですね。

* * *

中澤氏によれば、10年後には新聞記事なら直訳レベル、TwitterなどSNSの会話なら要約レベルで、ほとんどストレスなく外国語のテキストを読めることになりそうだ。外国語のニュースを読む、海外旅行先で買い物をするといった場面では、外国語のハードルは今よりはるかに下がっていくことが期待できる。

その半面、海外ドラマのジョークで笑ったり音楽の歌詞の真意をつかんだりするためには、何年経っても機械翻訳の出力だけでは不足しているようだ。文化的背景を含んだテキストを理解するには、翻訳結果とその背景にある情報や、自分自身が外国語を理解する努力がこれからも必要になるだろう。また大きな契約行為など確実な理解が必要となる場面では、仮に契約文書が定型的な表現ばかりであっても、機械翻訳だけに頼ることは賢明ではない。さしあたって10年程度の将来は、外国語を学ばずとも「だいたいわかる」範囲が劇的に広がっていくいっぽうで、人間の能力が不要になるわけではなく、外国語を学ぶ楽しさも維持されていきそうだ。

いつかはシンギュラリティが到来してコンピュータ上の独自言語が人間の言語を一掃してしまうかもしれないし、その時点では脳に埋め込んだチップ経由であらゆる言語が習得できるようになっていて、そこにコンピュータの新たな言語を追加するのもまったく苦にならないかもしれない。遠い将来のことはまだまだ不透明だが、少なくとも現在は多くの人にはとってありがたい状況が作られつつあるのだろう。

中澤敏明氏プロフィール
独立研究開発法人 科学技術振興機構研究員。博士(情報学)。東京大学大学院情報理工学系研究科、京都大学大学院情報学研究科博士課程、同特定研究員、特定助教を経て現職。専門は自然言語処理、特に機械翻訳で、現在は日本と中国の国立研究機関の共同事業である日中・中日機械翻訳実用化プロジェクトで中心的役割を担う。共著書に『機械翻訳(自然言語処理シリーズ)』(コロナ社)がある。国内外の数多くの学会で研究成果発表・講演などを行なう一方、TV・Webなどアカデミック外での情報発信も積極的に行ない、機械翻訳の実用化・普及に向けて精力的に活動している。

「他言語を学ばなくてもいい日」についてあなたの体験、考え、気持ちを聞かせてください。Twitterでの投稿は #機械翻訳 をつけて、ライター&編集部へ直接送るにはメール(fuze-pitch [at] mediagene.co.jp)かLINE@の1:1トークを使ってください。

#未来世紀シブヤ2017

100年後、「2017年の渋谷」はどんな姿をしているだろう?