Linux server.thearyasamaj.org 4.18.0-553.56.1.el8_10.x86_64 #1 SMP Tue Jun 10 05:00:59 EDT 2025 x86_64
Apache
: 103.90.241.146 | : 216.73.216.213
Cant Read [ /etc/named.conf ]
5.6.40
ftpuser@mantra.thearyasamaj.org
www.github.com/MadExploits
Terminal
AUTO ROOT
Adminer
Backdoor Destroyer
Linux Exploit
Lock Shell
Lock File
Create User
CREATE RDP
PHP Mailer
BACKCONNECT
UNLOCK SHELL
HASH IDENTIFIER
CPANEL RESET
CREATE WP USER
README
+ Create Folder
+ Create File
/
usr /
share /
doc /
mecab /
doc /
[ HOME SHELL ]
Name
Size
Permission
Action
en
[ DIR ]
drwxr-xr-x
bindings.html
9.25
KB
-rw-r--r--
dic-detail.html
7.99
KB
-rw-r--r--
dic.html
8.97
KB
-rw-r--r--
feature.html
10.49
KB
-rw-r--r--
feature.png
6.73
KB
-rw-r--r--
flow.png
29.29
KB
-rw-r--r--
format.html
5.81
KB
-rw-r--r--
index.html
23.28
KB
-rw-r--r--
learn.html
24.37
KB
-rw-r--r--
libmecab.html
15.07
KB
-rw-r--r--
mecab.css
2.67
KB
-rw-r--r--
mecab.html
2.52
KB
-rw-r--r--
partial.html
5.13
KB
-rw-r--r--
posid.html
4.36
KB
-rw-r--r--
result.png
34.89
KB
-rw-r--r--
soft.html
7.86
KB
-rw-r--r--
unk.html
2.39
KB
-rw-r--r--
Delete
Unzip
Zip
${this.title}
Close
Code Editor : unk.html
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd"> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>MeCab: 未知語処理</title> <link type="text/css" rel="stylesheet" href="mecab.css"> </head> <body> <h1>未知語処理の定義</h1> <h2>概要</h2> <p>未知語処理(辞書に載っていない単語の形態素解析の処理)についてユーザが再定義できます。</p> <h2>設定ファイル</h2> <p>配布辞書のディレクトリにある char.def と unk.def という2つのファイル を変更します.</p> <h3>char.def</h3> <p>未知語処理のルールです. <a href="learn.html">こちら</a>を御覧ください. </p> <h3>unk.def</h3> <p>未知語に対する品詞列のテーブルです. <a href="learn.html">こちら</a>を 御覧ください. </p> <h2>ケーススタディ</h2> <h3>数字の連続を1つの形態素とする</h2> <ul> <li>辞書 (*.csv ファイル)から数字のエントリを削除します。 ipadic の場合は、Noun.number.csv の中から、アラビア数字のエントリを消去します。 <li>char.def を修正し、数字の連続が未知語になるようにします。 <pre> .. NUMERIC 1 1 0 .. </pre> <li>unk.def を修正し、数字のコストを小さくします。 4カラム目のコスト値を 0以下の小さい値に設定します。 <pre> NUMERIC,1204,1204,0,名詞,数,*,*,*,*,* </pre> <li>辞書をコンパイルします。 <pre> % /usr/local/libexec/mecab/mecab-dict-index </pre> </ul> <h3>ASCII 文字列は、スペース/タブのみで分割する (kakasiと同一動作)</h3> <ul> <li>辞書 (*.csv ファイル)からアスキー文字列を含むのエントリを削除します。 <li>char.def を修正し、スペース、記号を除く文字を同一字種(ASCII)にマッピ ングします。他のエントリも同時にチェックし、0x0021..0x007E の領域を 他の字種にマッピングしないようにしてください。 <pre> ASCII 1 1 0 0x0021..0x007E ASCII </pre> <li>unk.def を修正し、ASCIIのコストを小さくします。 4カラム目のコスト値を 0以下の小さい値に設定します。 <pre> ASCII,1192,1192,0,名詞,サ変接続,*,*,*,*,* </pre> <li>辞書をコンパイルします。 <pre> % /usr/local/libexec/mecab/mecab-dict-index </pre> </ul> </body> </html>
Close