MeCabオープンソース形態素解析エンジンで、奈良先端科学技術大学院大学出身、現GoogleソフトウェアエンジニアでGoogle 日本語入力開発者の一人である工藤拓[1][2]によって開発されている。名称は開発者の好物「和布蕪(めかぶ)」から取られた。

MeCab
開発元 工藤拓
最新版
リポジトリ ウィキデータを編集
プログラミング
言語
C++C言語C#, Java, PerlPythonRuby
プラットフォーム クロスプラットフォーム
種別 形態素解析エンジン
ライセンス GPLLGPLBSD
公式サイト https://taku910.github.io/mecab/
テンプレートを表示

開発開始当初はChaSenを基にし、ChaSenTNGという名前で開発されていたが、現在はChaSenとは独立にスクラッチから開発されている。ChaSenに比べて解析精度は同程度で、解析速度は平均3-4倍速い。

品詞情報を利用した解析・推定を行うことができる。MeCabで利用できる辞書はいくつかあるが、ChaSenと同様にIPA品詞体系で構築されたIPADICが一般的に用いられている。

MeCabはGoogleが公開した大規模日本語n-gramデータの作成にも使用された[3]

Mac OS X v10.5及びv10.6SpotlightiPhone OS 2.1以降とOS X Yosemite以降の日本語入力にも利用されている[4][5][6]

脚注

編集
  1. ^ 「ググる」の精度を高めるために必要なもの - @IT自分戦略研究所”. ITmedia (2006年3月15日). 2009年4月9日閲覧。
  2. ^ 思いどおりの日本語入力 - Google 日本語入力”. Google (2009年12月3日). 2009年12月3日閲覧。
  3. ^ Google Japan Blog: 大規模日本語 n-gram データの公開”. Google (2007年11月1日). 2009年4月9日閲覧。
  4. ^ 大規模テキスト処理を支える形態素解析技術(工藤拓氏・Google)” (2009年12月3日). 2009年12月3日閲覧。
  5. ^ iPhoneの仮名漢字変換はMeCabを利用” (2009年12月3日). 2008年9月18日時点のオリジナルよりアーカイブ。2009年12月3日閲覧。
  6. ^ 「日本語入力」の基本”. MacFan. 2020年5月30日閲覧。

外部リンク

編集
pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy