総語数の計算(1) 「1行の平均語数」

[掲示板: 〈過去ログ〉YL・語数・書評システム情報 -- 最新メッセージID: 1253 // 時刻: 2024/4/29(21:31)]

管理用 HELP LOGIN    :    :


上へ上へ | 前のメッセージへ前のメッセージへ | 次のメッセージへ次のメッセージへ | ここから後の返答を全表示ここから後の返答を全表示 | 返答を書き込む返答を書き込む | 訂正する訂正する | 削除する削除する

773. 総語数の計算(1) 「1行の平均語数」

お名前: たむ
投稿日: 2005/6/11(10:10)

------------------------------

みなさんこんにちは。たむ2といいます。

「百万語多読」とか「1千万語めざすぞ」とかで、読んだ語数を
貯めていくのは、とてもいい方法だと思います。これがあるので
次々に新しい本に挑戦しようという気に、…私の場合は、なります。

先日来、The Sky Is Falling, Sidney Sheldonの語数について、
AMINOさんが、書評データで10万3千とされているのは多すぎる
ようだ、ご自分の計算では多くても8万語くらいと思うと投稿されました。
私も早速計算してみたところ、「少なく見積もって」8万という結果に
なりました。

さらにその後、す〜さんの投稿で、アメリカ・アマゾンで試験運用段階
ながら、本の総語数が調べられるとわかり、当の The Sky is… の
総語数は71,816語とわかりました。(このアマゾンの数字は信頼でき
るものなのでしょうか?、という点もありますが。)

はじめに語数を計算された方も、AMINOさんも私も、それなりに
計算したわけですが、どうしてこんなに違った数字が出てくるのか、
考えはじめたわけです。問題は、計算の基になる各数値の出し方
をもう少し誰がやっても同じになるようにできないものだろうか、と
いうことです。

SSS公式の「語数の数え方」は、まず「1行の平均語数」に「1頁の
行数」をかけて1頁の語数を出す。これに「補正した全頁数」をかけ、
さらに「文字率」をかけて総語数を出すようになっています。

A 1行あたりの単語数(平均)
B 1頁あたりの行数(最大のもの)
C 1冊あたりの頁数(補正する)
D 文字率 GR: 0.85 / 0.8  一般書 0.87 / 0.93

A [1行あたりの単語数]は、標準的な2〜4行を選び、1行あたりの
平均単語数を計算する。小数第2位で5捨6入する、となっています。

この「標準的な行」というのは私には見ただけではわかりません。
それで語数計算のときはいつも、なるべく語数の多そうな行を選んで
平均を出していました。折角読んだ本、なるべく語数を多くしたいと
いう心理が働くんでしょうか(笑)。

そこでふと思いついたのは、この平均を出す作業を4行といわず、
どんどん50行、100行と続けていったら、どうなるんだろう、
ことによると一定の値に収斂していくのではないだろうか、という
アイデアです。

早速Excelで表をつくり、最初からどんどん数えてみました。
(どなたか、Excelで「五捨六入」を実現するにはどうすれば
いいのか、教えていただけませんか。ROUND関数を使って
四捨五入はできるんですが。)

各行の語数を数え、記入した数字を累積して、行数で割って
いくわけです。ここで「行」というのは、行の終わりまでフルに
詰まっている行のことで、途中で終わっている行は「行」と
しては入れないことになります。ほかに、ハイフンでつながった
単語は1語と数えるとか、2:30や1945なども1語、などは
SSS公式ルールの通りです。ハイフンで分割された単語は
私は0.5と数えました。

結果は…Excelの表をご披露できないのが残念ですが、
みごとある段階から一定の数値に収斂しました。8.6±0.1
という値です。

また、この数字に収まってきたのは65行目からです。まだ
変わるかもしれないので、100行を過ぎて320行まですすんで
みましたが、どうやらもう変わらないようです。ただ、考えてみると
変わる可能性はあるわけです。320行を過ぎて語数の少ない
行がずっと続けばこの数値は落ちてくるでしょう。けれども
サンプル数(行数)が多くなればなるほど、変動の幅は小さい
はずと予想できます。

さて、この結果に勇気をえて、ほかのpaperbackではどうなる
か試してみました。

My Life, Bill Clinton, 1-4000-9671-5
The Blue Bedroom & Other Stories, Rosamunde Pilcher,
                                      0-312-92628-6
Cold Mountain, Charles Frazier, 0-340-71556-1
(全部未読の本です。はい(笑)。)

結果は次のとおりです。数字は、はじめから、サンプル数(数えた
行数)、収まってきた数値、収まりはじめた行数、です。The Sky Is
も加えました。

The Sky Is:  320,  8.6±0.1,  65
My Life:  304,  10.9±0.1,  33
The Blue:  312,  9.5±0.1,  51
Cold M.:  100,  12.2±0.1,  27

以上の結果をどう評価するか。

まず、一定の数値に収斂してくることに、数学上の根拠が
なにかあるのかどうか。なさそうな気もするし、いや数学者
ってとんでもないことを考えているから、ひょっとしたらある
のかも、といった程度です。

サンプルのpaperbackが少ないので、同じことを10冊くらい
の本でやってみると、はっきりしてくることがあるかもしれま
せん。

私としては、この4冊に限っていえば、上のやり方で100行
くらいやれば、一定の数値が出る、またその数値は誰が
やっても同じになる、ことに意義があると思います。

100行も数えるのはめんどうだし、簡便なやり方という
趣旨からもはずれてしまいますが。ただ、やってみると
その気になってやったせいもありますが、Excelの表が
決まってさえいれば、意外に簡単に、それほど時間も
かからずにできる、計算できるように思いました。

では、皆様もHappy Reading ! 
(私はここ二日ほど、やってませんが!)

▼返答


Maintenance: SSS 事務局
KINOBOARDS/1.0 R7.3: Copyright © 1995-2000 NAKAMURA, Hiroshi.