第14期第1回(通算第2回)「日本語処理解析性能評価」実施報告

デジタル・フォレンジック研究会では、第11期(2014年)に「日本語処理解析性能評価」分科会を立ち上げ、IDF会員及び官民のアドバイザーによるワーキングでの検討を逐次進めて参りました。第12期(2015年)には「評価基準」「評価データ」「評価手順」を作成し、第13期(2016年)に有識者からなる「評価委員会」にてこれらの確認を行い、評価の実施について承認を得ました。
これらに基づき第1回評価を、2016年8月より受検企業の募集を行い、2017年1月に2社の製品性能評価を実施致しました。

第2回目となるIDF第14期第1回評価を2017年12月15日(金)に実施致しましたので、この評価結果等について公開致します。

IDFでは、今期第14期年度内第3回(通算第3回目)の評価を実施する予定です。また、第15期(2018年度)以降も評価を実施して参ります。

☆これまで日本では、客観的な日本語処理解析性能評価に関する指標や基準が無かったことから、IDFが評価基準を設け、評価用データや評価手順を作成し、評価を実施していることの意義は大きいとの評価を頂いております。

尚、評価に使用した「評価基準」「評価データ」「評価手順」等は、第15期に入ってから、適宜の補備・修正等を行う予定で、その後、前期と同様に官公庁等公的機関へのこれらの評価ツールセットを貸与し、導入検討や使用中の製品の日本語処理解析性能の把握にお役立て頂く予定です。

【目的】
デジタル・フォレンジックやeディスカバリ用途で、多様な検索機能や解析機能を持つ多くのツールが開発され、利用されている。
しかしながら、海外で開発されたものも多く、日本国内で使用する場合に、どこまで日本語に対応しているかが不明でユーザーが使用してみるまで分からないのが現状である。
実際、フォレンジック調査やeディスカバリ作業現場において以下の様な問題が発生している。

・検索にヒットすべきものがヒットせず、重要な収集されるべきものが漏れる。
・文字化けが発生し、内容を確認できない。
・日本語処理対応とされるツールでも何がどこまでできるのかが不明確で使い込むまで分からないことが多く、精度をどこまで信用して良いか分からない。
・日本語処理対応の定義も不明確。
・実際に性能を評価しようとしても客観的かつ有効な指標も存在しない。

このような状況を踏まえ、日本語処理解析性能の「評価基準」「評価データ」「評価手順」を作成し製品の評価を実施することに致しました。

【評価の実施について】
第14期(2017年)10月より「日本語処理解析性能評価」受検製品(企業)の募集を開始し、同年12月に1社((株)くまなんピーシーネット)の「Intella」の製品評価を立会人の下に実施しました。
評価結果及び評価に関する受検企業からのコメント等は、「日本語処理解析性能評価」結果報告をご覧下さい。

【今後の評価実施について】
今期第14期(2017年度)内に、第2回(通算第3回目)の評価を実施する予定です。
また、第15期(2018年度)以降も評価を実施して参ります。

第2回「日本語処理解析性能評価」受検結果報告

【第2回受検実施企業】
2017年12月15日(金) 株式会社くまなんピーシーネット


※第1回「日本語処理解析性能評価」実施報告は以下よりダウンロードして下さい。
https://sakura.digitalforensic.jp/home/act/products/jpap_13_report01/

お問い合わせ

本報告に関するご意見、ご要望、その他のお問い合わせ等は、【ご氏名】【ご所属先】【ご連絡先】をご明記の上、以下の問い合わせ先へお寄せ下さい。

IDF事務局   E-MAIL:info@digitalforensic.jp

また、各受検企業結果内容の詳細及びお問い合せにつきましては、各「日本語処理解析性能評価」実施結果報告に記載しております、受検企業各社問い合わせ先へ直接お問い合わせ下さいますようお願い致します。