Re: フリーのコンコーダンス・ソフト

[掲示板: 〈過去ログ〉本のこと何でも -- 最新メッセージID: 3237 // 時刻: 2024/5/2(23:02)]

管理用 HELP LOGIN    :    :


上へ上へ | 前のメッセージへ前のメッセージへ | 次のメッセージへ次のメッセージへ | ここから後の返答を全表示ここから後の返答を全表示 | 返答を書き込む返答を書き込む | 訂正する訂正する | 削除する削除する

1758. Re: フリーのコンコーダンス・ソフト

お名前: ヨシオ
投稿日: 2006/8/5(17:16)

------------------------------

カリフォルニア・ガイさん、こんにちは、ヨシオです。

〉ハリポタでもダビンチコードでもいいんですが、語彙数(語数ではない)はどのくらいなんでしょうか。

テキスト・ファイルがあれば分かるのですが、Project Gutenbergなどに登録されている著作権が切れたものなら、フリーのコンコーダンス作成ソフトで語彙数を調べることができるようです。

[url:http://www.chs.nihon-u.ac.jp/eng_dpt/tukamoto/kwic.html]

〉アメリカの高卒の平均運用語数が5000〜7000、大卒が10000〜13000という話を聞いたことがあります。ダビンチコードの語彙数がわかれば、例えば高卒のアメリカ人がダビンチコードを読むときにどのくらいの語彙を推測しているかということがある程度わかりますね。これって興味深い数字です。

わたしは言語学には全然関係がないのですが、フリーのコンコーダンス・ソフトを使って、Project Gutenbergからダウンロードした、"ANNE OF GREEN GABLES / Lucy Maud Montgomery"の語彙数を見てみました。7448なんですね。高校生で十分、ということでしょうか(^^;

Total Tokens: 107147
Total Types: 7448
Type-Token Ratio: 0.069512
Average Word Length: 4.039777

Total Tokensが全単語数だと思います。Total Typesが語彙数で、平均の単語長は4文字なんですね。

また、単語の出現頻度も以下のように分かります。ANNEの名前が1213回なんですね。面白い。よく呼ばれるからかな?(^^;

the 3926
and 3397
i 3264
to 3045
a 2225
it 2099
of 1923
you 1701
she 1519
in 1479
that 1371
was 1364
her 1312
anne 1213

また、"happy"という単語のコンコーダンスを作成すると、以下のように、50の文章でヒットしたようです。

Keyword: happy
Keyword Position: 50

(673)
did? But just now I feel pretty nearly perfectly happy. I can't feel exactly perfectly happy
(674)
perfectly happy. I can't feel exactly perfectly happy because--well, what color would you call
(689)
"Now you see why I can't be perfectly happy. Nobody could who has red hair. I don't
(1744)

ハリーポッターやダビンチコードの電子ファイルがあれば、語彙数は分かるのでしょうが、著作権の問題で無理かな。

では〜。


▲返答元

▼返答


Maintenance: SSS 事務局
KINOBOARDS/1.0 R7.3: Copyright © 1995-2000 NAKAMURA, Hiroshi.