総語数の計算(8)

[掲示板: 〈過去ログ〉YL・語数・書評システム情報 -- 最新メッセージID: 1253 // 時刻: 2024/5/12(15:01)]

管理用 HELP LOGIN    :    :



上へ上へ | 前のメッセージへ前のメッセージへ | 次のメッセージへ次のメッセージへ | ここから後の返答を全表示ここから後の返答を全表示 | 返答を書き込む返答を書き込む | 訂正する訂正する | 削除する削除する

813. 総語数の計算(8)

お名前: たむ
投稿日: 2005/7/24(19:51)

------------------------------

みなさん、こんにちは。たむ2です。

総語数の計算法を考えていますが、ようやく私の中で
クリアになってきました。これまで、とくに成算もなく
あちこち話が飛んできましたので、お読みいただいた
方にはご迷惑な話であったかと想像しています。

一冊の本を大きい円にたとえると、その中にいくつもの
中円(頁)と、さらにその中円各々の中ににいくつもの
小円(行)が見て取れます。小円の中は単語が詰まって
いたり、空の小円もあるわけです。

総語数の計算は、要するに、どこか「部分」を選んで
大円の中にある総語数を計算で推測しようという
ことです。

総語数の計算法は、この「部分」をどこにするか、
どれくらいの分量にするか、また、補正をするかしないか、
ということに尽きるわけです。それ以外の要素は考えられ
ないと思うのですが、いかがでしょう。

具体的にいいますと、私が「単純比例計算」と呼んでいる
方法があります。

これは、「最初の3頁」の語数を数えて、次に総頁数を掛ける
だけの計算法です。補正はしないのです。

これは、上で述べた「部分」を「最初の3頁」として
補正なし、とするわけです。なぜ、「最初の」「3頁」なのか、
に確たる理由はありません。「最初の」には多少意味がある
ことを後に説明します。しかし「3頁」というのは、3頁も
語数を数えたらうんざりするから、という程度のことです。

そんな大雑把なやり方では誤差が多いにちがいないと
思われますが、これが、意外に、誤差が多いとも決めつけ
られないのです。

具体的に、何冊かの本でみてゆきます。

These Happy Golden Years,
Laura Ingalls Wilder,
ISBN 0-06-440008-5
Number of words : 64,113

この本の「最初の3頁」の語数は645語です。
また総頁数は289です。
したがって、計算総語数 = 645×(289 / 3)
                       = 62135
となります。

誤差は、(62135 / 64113)×100 = 96.91..
で、−3.1%になります。

上で、「3頁」というのはそれくらい数えると
うんざりするからと理由をあげましたが、では
4頁、5頁…と数えてみるとどうなるか。

4頁: 920×(289 / 4) = 66470
5頁: 1146×(289 / 5) = 66238.8
6頁: 1418×(289 / 6) = 68300.3…
7頁: 1647×(289 / 7) = 67997.5…
8頁: 1899×(289 / 8) = 68601.3…
9頁: 2179×(289 / 9) = 69970.1…
10頁: 2374×(289 / 10) = 68608.6
となります。

それぞれ誤差は
4頁: 103.67… +3.7%
5頁: 103.31… +3.1%
6頁: 106.53… +6.5%
7頁: 106.05… +6.1%
8頁: 107.00… +7.0%
9頁: 109.13… +9.1%
10頁: 107.01… +7.1%

これを見ると、この本の場合、サンプルとして取りあげる
「部分」の量を多くしても、誤差が少なくなるわけではない、
とわかります。

さて、ここで、一般的にものごとを考えてみたとき、
否定的なことを言うのは簡単で、1例でも反する
事象があれば、否定できるわけです。しかし反対に
肯定するのはとても難しい。あることについてAと
いうことが成り立つ、と言おうとしても1例でも反例
があれば否定されてしまうわけです。(じゃあ、肯定的
なことは何も言えないじゃないか、となりますが、まあ
そうでもないわけです。これは、仮説・実験の網の目
を広げることで、あることはほぼ確かだという結論を
得ることもできるわけです。)

したがって、この本の例だけで肯定的なこと、積極的な
ことを何か言うわけにはいかないわけですが、それでも
あえて言えば、最初の3頁を数えて頁数をかけただけ
で、5%以内の誤差におさまってしまうのではないか、
あるいは、最初の数頁の語数に頁数をかけると、誤差
10%におさまるのではないかという仮説をたてることは
できるわけです。

話しを戻してみると…サンプルの部分をどうとるか、
補正をどうするか、から、具体例として補正「しない」例を
取りあげたわけです。したがって、次に補正「する」例を
取りあげるのが話しの順序ですが、その前にこの補正
しない例をもうすこしみておく必要があります。そこで
次回はこの単純比例計算をほかの何冊かの本で
しらべてみたいと思います。

長くなりますので、今日はここまでにします。
読んでいただいて、ありがとうございます。

上へ上へ | 前のメッセージへ前のメッセージへ | 次のメッセージへ次のメッセージへ | ここから後の返答を全表示ここから後の返答を全表示 | 返答を書き込む返答を書き込む | 訂正する訂正する | 削除する削除する

814. たむさんへ、Re: 総語数の計算(8)

お名前: バナナ
投稿日: 2005/7/26(18:40)

------------------------------

バナナです。

私、たむさんの、この一連の投稿、おもしろく拝見させて
いただいています。

こういう(数学関係の)話はすきなのです。
すきだけど、口を出すほど、詳しくないのが悲しい。

口が出せるような話題があったら、口を出します。

続き楽しみに待ってます。

一読者より

ではでは


上へ上へ | 前のメッセージへ前のメッセージへ | 次のメッセージへ次のメッセージへ | ここから後の返答を全表示ここから後の返答を全表示 | 返答を書き込む返答を書き込む | 訂正する訂正する | 削除する削除する

816. みちるさん、酒井先生、バナナさん、ありがとうございます

お名前: たむ
投稿日: 2005/7/27(18:01)

------------------------------

みちるさん、酒井先生、バナナさん、ありがとうございます。

みちるさん、3頁連続はとくに理由はないとのこと、そうですね。
それから、補正の数え方、みちるさんのは熟練技というか名人芸
ですね。ざっと数えてあの誤差ですからね。みちるさんのように
軽やかにいかないところがどうも難点です。

酒井先生のおすすめもあり、ぜひ「みちる方式」の名前、使わせて
いただきますよ。いいですね。(軽やかにはいかずちょっと重く
なるかもしれませんが。)

バナナさん、お久しぶりです。読んでいただいていたなんて、
嬉しいです。バナナさんはこちらの方(こちらってどちらか
よく分からないのですが)の専門家では?私のやってるのは
足し算、引き算に百分率の計算くらいですから、あるのは
数値の見間違いくらいのものです。近眼に老眼がかさなり
メガネをはずしたりかけたりめんどうなことこの上なしの
状況です。

ちょっと前から、サンプルになる本の選択に苦労しています。
なにしろ、ようやくアメリカ・アマゾンに入れるようになり、
なんとか目的のところにたどりつけるようになったという
ところなんです。手持の本をいろいろ入れてみて、データ
のあるものを探しています。

またよろしくお願いしまーす。
最近、400万語通過したんですよ。
そろそろタドキスト中堅かと思ってます。
酒井始祖、みちる先達、バナナ先輩に続きます。
では、また。

タイトル一覧へ(返答順)(B)

タイトル一覧へ(日付順)


Maintenance: SSS 事務局
KINOBOARDS/1.0 R7.3: Copyright © 1995-2000 NAKAMURA, Hiroshi.