総語数の計算(6)

[掲示板: 〈過去ログ〉YL・語数・書評システム情報 -- 最新メッセージID: 1253 // 時刻: 2024/5/12(03:04)]

管理用 HELP LOGIN    :    :


上へ上へ | 前のメッセージへ前のメッセージへ | 次のメッセージへ次のメッセージへ | ここから後の返答を全表示ここから後の返答を全表示 | 返答を書き込む返答を書き込む | 訂正する訂正する | 削除する削除する

800. 総語数の計算(6)

お名前: たむ
投稿日: 2005/7/18(16:00)

------------------------------

皆さんこんにちは。たむ2です。

4週間パソコンが使えず、手足をもがれたような
苦しい生活を送っておりました(多読はすすみました)。
Excelが使えないので、総語数計算もお休み状態でしたが、
また復活したいと思います。

These Happy Golden Years,
Laura Ingalls Wilder,
ISBN 0-06-440008-5

これは「大草原の小さな家」シリーズの1冊で、
私も現在読んでいるところです。この本は、
paperbackの装丁ですが、挿絵も結構あり、
子供も読む本でしょうから、児童書でもあるという
中間的な性格の本だろうと思います。

この本はアメリカ・アマゾンで総語数64,113語となっています。
(これ、ほんとにありがたいですね。日本のアマゾンも早く導入して
ほしいです。)

また、SSS書評のデータでは60,000語となっていますから、
かなり正確です。誤差は (60000 / 64113)×100 = 93.6 (%)
ですから、−6.4%ということになります。

この本の基本データは次のとおりです。
   頁 行数 単語数   本文頁数=289
   1    15   129         挿絵: paperbackとしてはかなりある
      2    28   254         最大行数: (後述)
      3    28   262
     合計  71   645

最大行数ですが、はじめのうちは28行なのですが、その後
29行と28行が交互に続いていて、どちらとも決められません。
最大行数ですから29行としていいようにも思いますが、
総語数の計算にかかわることで、どちらとも決めかねます。
(全部は調べていませんが、28行も結構多いのです。)

最初の行の活字の頭から、最終行の活字の底までの
長さを測ってみると!(せこいと笑わないでくださいね。)、
28行151mm, 29行156mmくらいになっている
ようで、5mmの違いは、見ただけではわからない
ですね。

仕方がないので、一応、最大行数28.5としておきます。

◆まず、もっとも単純な比例計算をしてみます。
基本データでは最初の3頁で645語となっていますから、
これが総頁数289ではどうなるか。
  645×(289 / 3) = 62135
となります。かなり正確です。
誤差は (62135 / 64113)×100 = 96.9(%), −3.1%
で、これで十分実用になっちゃうところが、素晴らしいと
いうかいまいましいというか…。

◆次に、SSS公認方式で計算してみます。
A(1行あたりの単語数)ですが、標準的な2~4行を
選び、平均を出します。(少数第2位で五捨六入)
(古川先生、四捨五入でないことには何か意味が
あるのでしょうか?)

「標準的な行」というのは、フル行(行の最後まで文字の
つまっている行)の中で「標準的な行」ということだと
思います。しかし、どれが標準的な行かは見ただけでは
分からないと思いますので、最初からフル行を4つ選ぶ
ことにすると、
  page1, line4→9語、以下同じく 1, 5→10, 1, 8→9,
  1, 12→7となりますので、
 A = (9+10+9+7)/ 4 = 8.7 となります。

次にB(最大行数)ですが、上で述べた理由で 28.5とします。

C(総頁数)は289ですが、1頁まるまる挿絵という頁が4頁
(page 93, 167, 228, 281)あります。また、部分的な挿絵も
結構多いのですが、とりあえずそれには目をつむって、
  C = 289−4 = 285
とします。

Dについては、0.87 / 0.93のどちらかを選ぶことになって
いますが、この本は0.87とします。

以上から、総語数は
  8.7×28.5×285×0.87 = 61479
となります。これもかなり正確で、誤差は
  (61479 / 64113)×100 = 95.9 (%)
−4.1%となります。

ちなみにA(1行の平均文字数)がいくつだったら
もっとも正確な総語数になるか逆算してみると
A = 9.1となります。
  9.1×28.5×285×0.87 = 64306

◆第三方式
第三方式は、みちるさんが実際に使われていた方法で、
この掲示板の No.783で次のように書かれています。

(引用)ちなみに、私の場合は、児童書、PBともに、読み終わった
後に、平均的かなぁと思う3ページを数えます。章題や章の終わりの
空白、挿絵による空白を大体数えて頁数をひき、
  (3ページの語数÷3)×(全頁−空白をページ相当にした頁数)
で語数を出していました。(中略)普通の人が楽に数えられる量が
結構大事かもしれませんね。

この方式がいいのは、直感的・素直なことで、3頁で1頁の平均語数を
出し、空白行や挿絵の部分を補正して頁数を出し、総語数を計算して
いる点です。

これが一番常識的でわかりやすい方法ではないでしょうか。しかも、
この方法であれば、GR、児童書、PBを区別しないで、同じやり方で
計算できるのです。

まず「平均的な頁」ですが、これはフル行に対応したフル頁(つまり、
頁の全面に行があり、空白行がない頁)の中のこととします。「平均的」
も選びようがないので、本のはじめの方、真中、終わりの方でフル頁
を選んでみました。
	Page 3→262,  145→248,  286→280
で1頁平均263語となります。

次に、空白・挿絵の部分を差し引く作業ですが、これがかなり
大変であることが分かりました。この本が児童書とpaperback
の中間的な性格であることから、paperbackにしては挿絵が
多く、児童書にしては総頁数が多すぎるのです。また、この本
の章にあたるものは33もあって、それだけでも大変になり
ます。

みちるさんが具体的にどのような方法をとっているか、
分かりませんので、次のようにしてみます。

最大行が28.5ですので、空白行や挿絵のある頁では
文字のある行数を数え、それを28.5から引きます。
(このあたりExcelで表を作っておいて、数字を打ち
込めば28.5の補数がでてくるようすると、少しは
手間が省けます。)

表が、こちらにきれいにコピーできないので省略しますが、
結果は計1059行、つまりこれだけの行には文字がない
ことになります。
   1059 / 28.5 = 37.15..
したがって、文字のある頁数は
    289−37 = 252

総語数は 263×252 = 66276
誤差は (66276 / 64113)×100 = 103.37…
+3.4%になります。

◆改訂SSS公認方式
  上のSSS公認方式では、8.7×28.5×285×0.87 = 61479
となりましたが、第三方式で空白頁を差し引いた数字が252頁と
でました。これをSSS公認方式に代入してみますと、0.87は不要
になりますので(?、ここちょっとあやしいです。文字率は二つの役割
があるように思っています)、
    8.7×28.5×252 = 62483.4 → 62,483 という数字が得られ
ます。この誤差は、(62483 / 64113)×100 = 97.45… 97.5%となり
−2.5%という驚異的な数字になります。

◆以上の結果を並べてみますと、
	改訂SSS公認方式 誤差 −2.5%
	単純比例計算 誤差 −3.1%
	第三方式 誤差 +3.4%
	SSS公認方式 −4.1%
となります。

どの方式も±5%に収まったのは、意外でした。
単純比例計算は乱暴なやりかたなのに、健闘
してますね(笑)。改訂SSS方式、第3方式にもう少し
工夫の余地があるように思います。

長くなりました。また、考えます。
では、皆様 Happy Reading !

▼返答


Maintenance: SSS 事務局
KINOBOARDS/1.0 R7.3: Copyright © 1995-2000 NAKAMURA, Hiroshi.