医療分野を対象とした多言語用例対訳共有システムTackPadの開発

１背景と目的

近年，訪日外国人や在日外国人は増加しています．しかし，日本語が理解できない外国人への対応は十分なものとは言えません．特に医療分野では，医療従事者と患者との正確なコミュニケーションが重要です．日本語が通じない外国人と日本人の医療従事者間のやりとりは，意思の疎通が十分に行えずに医療ミスが発生する可能性があるためです．

そこで本研究では，医療に関する正確な多言語用例対訳を収集・共有し，収集した用例を他の多言語対応システムに提供することによって外国人患者の支援を行うことを目的としています．

２多言語用例共有システムTackPad

多言語用例対訳共有システムTackPad(タックパッド)は，医療に関係する多言語用例対訳を収集しています．用例対訳とは，同じ意味の用例を多言語で集め，まとめて管理したものを指します．TackPadはWeb上のサービスのため，インターネットブラウザのみでシステムを利用することができます．現在は，日本語，英語，中国語，韓国語，ポルトガル語，スペイン語，ベトナム語，タイ語，インドネシア語の9か国の用例対訳を収集しています．

システムの構成は図１のようになっています．TackPadの主な機能としては，用例の提案，対訳の作成，用例対訳の検索の3つがあります．

図1. TackPadのシステム構成

(1) 用例の提案

医療従事者や患者などが，他の言語に翻訳してほしい用例を提案する機能です．それぞれの立場から見て，必要と感じている用例をシステムに提案することができるので，本当に必要とされている用例対訳を集めることが可能となっています．

(2) 対訳の作成(翻訳を行う)

提案された用例を翻訳する機能です．翻訳支援機能として，翻訳元の言語と翻訳先の言語を指定すると，翻訳可能な用例をソートして表示する機能を用意しています．

(3) 用例対訳の検索

収集された用例対訳を検索する機能です．用例の検索のみではなく，用例を登録した人のコメントや，付けられたタグでの検索も可能となっています．

３TackPadの特徴

多言語用例対訳の収集では，翻訳者が重要な存在となっています．翻訳者の方が翻訳という仕事をしていると感じないようにする工夫として，図２のように楽しいイメージのシステム作りを行っています．また，他にも使いやすくする工夫をしています．

図2. TackPadの画面

(1) プロジェクト型用例収集支援機能

TackPadでは，医療分野に関する用例対訳の登録を自由に行う事ができます．しかし，医療分野と言っても範囲が広く，利用者の人は難しいと考えられます．

そこで，「プロジェクト型用例収集支援機能」を用意しています．この機能では，用例の収集対象を「受付」や「薬局」などにあえて絞っています．また，収集期間を一週間から二週間程度に制限しています．収集対象分野を絞ることで，利用者は登録する用例を考えやすくなり，収集の促進が図れると考えられます．また，用例の収集期間を制限することで，効率的に用例の収集を行う事が可能だと考えられます．

(2) タグ機能

用例コーパスから目的の用例を探すときは，通常単語一致検索で行います．しかし，あるカテゴリに属する用例を探したいという要望にこたえることは困難です．TackPadでは，利用者が自由に追加することのできるタグを用意することで，検索をより行いやすくしています．

４用例対訳の正確性確保

TackPadに登録されている用例は，医療従事者や翻訳者が作成しています．収集された用例は他の多言語対応システムへ提供しますが，この時に重要となるのが“用例の正確性”です．しかし，登録された用例の正確性は用例作成者に依存しています．このため，用例作成者以外による用例の正確性の確保が必要となります．

(1) 評価機能

用例の正確性を確保するための機能です．TackPadでは，Web上の評価でよく利用される5段階評価ではなく，軸の両側に対義語を用意し評価対象の用例がどちらに近いかを評価する形を取っています(図3)．また，一つのみではなく複数の評価基準を設けることで，評価者の意図をくみ取れるように工夫しています．

図3. 評価機能

(2) Web検索・機械翻訳を用いた用例対訳の自動正確性評価

Web上には既に用例対訳が存在しています．また，機械翻訳はある一定程度の精度で翻訳することができます．これらのことから，Web検索や機械翻訳を用いて用例対訳の自動正確性評価を行っています．

Web検索を用いた用例対訳の自動正確性評価は次の手順で行っています．

分析対象用例対訳を，形態素解析器で形態素ごとのN-gramデータに分割
分割したN-gramデータを用例間で組み合わせてWeb検索で検索し，検索ヒット件数を記録する
検索ヒット件数が1件以上の割合を用例対訳ごとに調べ，その割合が0%(ヒットしない)場合を「不正確用例対訳候補」とする

機械翻訳を用いた用例対訳の自動正確性評価は次の手順で行っています．

分析対象用例対訳のうち，翻訳元となった用例を機械翻訳で翻訳する
翻訳結果と翻訳先用例を，形態素解析器で形態素ごとのN-gramデータに分割
分割したN-gramデータを比較し，同一の単語が存在しない場合を「不正確用例対訳候補」とする

５今後の課題

用例対訳の自動正確性評価の評価性能向上
用例対訳収集の促進
用例をWebサービスで他のシステムに提供する機能の追加(連携先例：多言語医療受付支援システムM³)

口頭発表

福島拓，宮部真衣，吉野孝，西村竜一，重野亜久里：医療分野を対象とした多言語発話収集WebシステムOTOCKERの開発，電子情報通信学会技術研究報告，AI2007-14，pp.17-22(2007-11)．
福島拓, 宮部真衣, 吉野孝, 重野亜久里：医療分野を対象とした多言語用例対訳収集WebシステムTackPadの開発，マルチメディア，分散，協調とモバイル（DICOMO2008）シンポジウム，pp.1030-1036(2008-7)．
福島拓, 吉野孝, 重野亜久里：多言語用例対訳共有システムTackPadの評価機能の実現と評価，情報処理学会研究報告，グループウェアとネットワークサービス研究会，2009-GN-70(21)，pp.121-126(2009-1).
福島拓，吉野孝，田淵裕章，北村泰彦：多言語用例対訳を用いたコミュニケーションのための応答用例対作成システムの開発，マルチメディア，分散，協調とモバイル(DICOMO2009)シンポジウム，pp.1612-1618(2009-07).
福島拓，吉野孝，重野亜久里：多言語用例対訳共有システムTackPadの用例評価手法の評価，FIT2009 情報科学技術フォーラム，pp.411-412(2009-09).
福島拓，吉野孝：多言語用例対訳共有システムTackPadにおける用例評価手法の比較，情報処理学会，グループウェアとネットワークサービスワークショップ2009，pp.87-92(2009-09).
福島拓，吉野孝，重野亜久里：多言語用例対訳共有システムのための用例間評価手法の評価，情報処理学会第72回全国大会，第2分冊，pp.485-486(2010-03).

受賞

マルチメディア，分散，協調とモバイル(DICOMO2008)シンポジウムヤングリサーチャ賞(2008-07)
マルチメディア，分散，協調とモバイル(DICOMO2008)シンポジウム優秀論文賞(2008-08)
マルチメディア，分散，協調とモバイル(DICOMO2009)シンポジウムヤングリサーチャ賞(2009-07)

謝辞

本研究の一部は，総務省の戦略的情報通信研究開発推進制度(SCOPE) の平成20年度採択課題「多言語共生社会における医療対話支援のための多言語対話用例プラットフォームの構築」によって行われました．

連絡先

福島拓：s105044 at sys.wakayama-u.ac.jp
吉野孝：yoshino at sys.wakayama-u.ac.jp

リンク

多言語用例対訳共有システムTackPad

研究紹介のページに戻る