ソーシャルメディアを活用し、その時代にあった日本語学習が行える教材を開発
〜データセクション、ベトナム国立ハノイ工科大学
IT日本語主任教員 権代祥一氏と共同でテキストマイニング技術を応用〜
データセクション株式会社(本社:東京都渋谷区、代表取締役社長:澤博史、以下 データセクション)は、ベトナム国立ハノイ工科大学 権代祥一氏(※1)と共同でソーシャルメディアをもとにし、テキストマイニング技術を応用した日本語学習システムを開発いたしました。
近年オフショア開発拠点として注目が集まっているベトナムでは、特にIT分野の日本語に精通した人材の不足が課題とされています。権代氏はこれまでのベトナムでのIT日本語教育の経験から、現状のベトナムにおいてIT実務で必要とされる日本語を習得するための適切な教材がないことを課題と感じていました。そこでデータセクションは権代氏と共同でベトナム人向けIT技術者育成支援として、データマイニング技術を用いた日本語学習システムを開発いたしました。2013年11月1日に本システムを利用したベトナム向けのサービス提供開始を予定しており、さらに今後は、同技術を活用した英語、アジア各国の言語に対応した語学学習サービスの展開も予定しております。
■「日本語学習システム」3つの特長
今回発表致します日本語学習システムは、ITに特化した最新ワードや頻出度ランキング、関連用語リストを特長としたシステムであり、本システムを活用してベトナム人エンジニアの日本語の習得を目的としています。本システムはデータ自動更新機能や、関連語自動抽出等の機能を持っており、これらを活かし効率的な日本語学習を支援します。また、現地で日本語教育の課題のひとつとされている教育コスト削減の点に関しても、IT化によって安価に抑えることが可能になります。本システムの特長は以下の3点です。
(1)web上の膨大なテキストデータから自動的に検索すべき単語群を抽出
効率的な言語学習を行おうとする上で、大規模な単語データを関連語に分けてリスト化するには多大な労力が必要とされました。また、例えリスト化しても関連性や使用法が分からないという課題がありました。本システムでは、データセクションのテキストマイニング技術によって、大規模データの中から関連語の自動抽出を行い、特定の業界における慣用表現や商習慣に関する言葉を機械的に抽出・リスト化が可能になりました。検索したいカテゴリを入力すると、Web上の収集されたキーワードの中から、関連ワードが表示され、検索すべき単語群を瞬時に抽出することができます。
(2)自動更新により常に最新のワードを学ぶ事が出来ます
IT分野は技術の進歩やトレンドの移り変わりが早く新出語が多いので、既存の教材では内容の陳腐化が非常に速く、開発の現場で即活用可能な日本語を学ぶのは難しいという課題がありました。本システムの最新データ自動更新機能は、クローリング技術により定期的に更新されるテキストコーパスをベースに進出単語も併せて抽出・ランキング化します。これにより、常に新出単語をキャッチアップ出来るので、最新のIT単語をリアルタイムで学ぶことができます。
(3)各単語間における係受け等の関連性を可視化、有機的な学習を可能に
これまでの単語学習教材では、単に類義語を一覧表示したものが多く、関連する語同士の結びつきについての解説が乏しいという課題がありました。本システムでは、各単語を品詞別に相関グラフ化することによって、各単語同士の繋がりが一目で把握できるようになります。単語間の繋がりが強く、共起されやすい名詞と動詞をセットにして覚えることや、共起頻度の高低を明らかにすることで、文脈に沿った有機的な単語学習が可能になります。
脚注
※1:権代祥一(ごんだい しょういち)主任教員
メーカー系のシステムエンジニアとして主に原子力関連、宇宙関連、交通関連などの、社会・公共系のシステムの開発に携わる。その後、フィリピンと中国でのオフショア開発管理業務等を経て、2010年よりハノイ工科大HEDSPIプロジェクト(※2)にIT日本語教員として着任。
※2:HEDSPI(Higher Education Development Support Project on ICT)
ハノイ工科大学ITSS教育能力強化プロジェクトのプログラムで、日本語のできる高度IT人材を育成を目的としている。日本国のODAを使用し、ハノイ工科大学に特別コースを設け、日本側のパートナー校を立命館大学と慶應義塾大学として実施されている。