dataは単数形(data is)か複数形(data are)か?

Pocket

日本語の「データ」は英語のdataがそのまま訳されたものですが、dataを可算名詞(count noun)の単数形と思い込み、dataの複数形はdatasと勘違いする人がいるようです。学術文献を検索できるGoogle Scholarsで確認するとdatasという単語を使っている論文が見つかりますが、

Although many vertex datas between GPUs must be exchanged to run BFS on multi GPUs system… (GPU-BOXにおける幅優先探索の高速化, 2014)

Thus, the vaporliquid equilibria datas in this study satisfy the requirement D-J<10. (酢酸-水系の気液平衡に及ぼす塩効果, 2014)

In this study, we … propose a way to find parameters for calculating evaluation value by learning datas of actual novices ‘ move. (将棋初心者の着手を予測するための評価関数の検討, 2015)

The extracted structures are qualitatively similar to the experimental datas. (極超音速流における不安定モード成長の数値解析, 2016)

This time I produced the 3D datas with view to data preservation and utilization of cultural assets (Memento を用 い た 灯籠 の 3D , 2016)

もちろん、datasという単語は存在しません。「データ」の複数形はdataです。だから

These data are summarized in Table 5. (これらのデータは表5に要約されている。)

と表現できます。しかし、dataが単数形として扱われている文章もよく見かけます。

The data was collected by trained interviewers. (データは訓練されたインタビュアーによって集められた。)

dataは単数にも複数にもなるということです。では、どのようにして使い分けられるでしょうか?

 

■dataはなぜ複数形になるのか

単数形datumの複数形がdataです。どちらもラテン語からきた言葉です。datumという単語と共に1640年頃に英語に導入されました。ラテン語では「与件(something given)」という意味でしたが、今では「データ」(details, facts, and statistics collected for reference or analysis)という意味で使われています。つまり、dataは元々可算名詞の複数形だったわけです。ラテン語を語源とする単語は複数形の語尾が-aになります。agenda, candelabra, criteria, media, phenomena, stamina, strataはそれぞれ元々agendum, candelabrum, criterion, medium, phenomenon, stamen, stratumの複数形です(注: agendaなどその多くは今は単数形として扱われています)。

昔ながらの語法に従うと、dataは常に複数形なので「1つのデータ」という表現をしたいときはdatumという単語を使う必要があります。

The individual datum is not conclusive, so more data are needed. (個々のデータでは結論付けられないのでもっとデータが必要である。)

しかし、datumという単語はごく特殊な用法以外では死語となり(注: 地図作製法、地理学、核磁気共鳴ではdatumが「測量基準点(any level surface, line, or point used as a reference in measuring elevations)」という意味で今でも使われています。しかし、その複数形はdataではなくdatumsです)、

 

単数形のdataがいる秘密

しかしdataが単数形として使われることがあります。というか、単数形として使われる方がはるかに多いです。dataが「抽象名詞(abstract noun)」として扱われているからです。抽象名詞は数えられないので複数形が存在せず、常に単数形の形を取ります。同じ抽象名詞のinformationをinformationsとは言わないのと同じことです。不可算名詞のdataはa body of factsもしくはinformationという意味になります。

Additional data is available from these websites.(追加データはこれらのウェブサイトから利用できる。)

つまり、dataは単数形としても複数形としても使われます。ということで英語文献を読んでいると、data is…とdata are…という文章のどちらも見かけます。では、単数形と複数形のdataをどう使い分ければよいのでしょうか。

 

■dataは単数と複数のどちらの方がポピュラーなのか?

アカデミックな学術論文や政府の公式文書ではdataを複数形扱いにするのが今でも主流です。つまりthe data are or the data showとなります。例えばthe Office for National Statistics(英国の国家統計局)のスタイルガイドラインには、dataはpluralであるとはっきり書かれています。

APA Styleのブログ(July 26, 2012)でTyler Krupaは複数扱いにすべき理由として、科学的な結果におけるデータは常に複数であることをあげています。

Keep in mind that most of the time the plural form data should be used. Scientific results are built upon testing things multiple times across multiple people, and we draw conclusions from the aggregate, not the individual, data points. Therefore, when referring to the collective results, be sure to use the plural form.

Royal Roads UniversityのWriting Centre CoordinatorのTheresa Bell (Jan. 30, 2014)やThoughtCo.のWhat Is the Plural of Data?という記事も問答無用でdataは複数形扱いだと主張しています。実は学術論文でもdataを単数扱いにする研究者が増えているのですが(例えば、The Chicago Manual of Styleは単数/複数併用を支持しています)、今でも頑なに「ラテン語ではdataは複数形だ。だから英語のdataも複数形にしないとだめだ。」と主張する人がいます。そういう人が査読論文のレフェリーにあたると、何かと面倒なので学術論文ではdataを複数扱いにする方が無難とは言えます。

ただし日常会話ではdataは単数形扱いの方が一般的です。つまり、The data indicate unemployment is still high. The data indicates unemployment is still high. と書いてまったく問題がないというわけです。ただしニュアンスは変わります。Merriam-Webster’s Collegiate Dictionaryにはdataを複数扱いにするとstuffy (堅苦しい)、単数扱いにするとuneducated (無学の、教養のない)に聞こえると書かれています。それはつまり堅苦しくてよい論文やフォーマルな文書では複数形でかまわないということを意味します。これはhttp://www.lexically.net/TimJohns/Kibbitzer/revis006.htmでの調査でも明らかになっています。

Publication Frequency Marked plur/sing Plural Singular
Nature 1:563 187 (23.6%) 175 (93.6%) 12 (6.4%)
New Scientist 1:1,970 123 (16.4%) 84 (69.9%) 39 (30.1%)
Guardian 1:22,047 81 (10.8%) 32 (39.5%) 49 (60.5%)

 

dataを複数/単数扱いのどちらで使われているか3誌で調べたところ、学術論文誌のNatureでは93.6%が複数扱いされているのに対し、よりインフォーマルな週刊誌のNew Scientistでは69.9%が複数扱い、そして日刊紙のGuardianでは比率が逆転して39.5%が複数扱い、60.5%が単数扱いになっています。ちなみにこの調査は約20年前に行われています。今では単数扱いの比率がもっと上がっているはずです。ためしにGoogle Ngram Viewerでdata isとdata areの使用数を調べたところ、1910年頃を境にdata isがdata areを追い越し、今は圧倒的にdata is優位の状況になっています。

新聞はアカデミックジャーナルよりもはフォーマルではありませんが、一般人からすると新聞は十分フォーマルな媒体と言えます。その新聞のほとんどがdataを単数/複数併用という立場をとっています。例えば、The Wall Street JournalはIs Data Is, or Is Data Ain’t, a Plural? (July 5, 2012)の記事で、dataを複数扱いばかりすることを今後放棄する宣言をします。

“Most style guides and dictionaries have come to accept the use of the noun data with either singular or plural verbs, and we hereby join the majority. As usage has evolved from the word’s origin as the Latin plural of datum, singular verbs now are often used to refer to collections of information: Little data is available to support the conclusions. Otherwise, generally continue to use the plural: Data are still being collected.”

The EconomistはData are? Revisited: The Wall Street Journal straddles the fence on this perennial usage debate (July 6, 2012)でThe Wall Street Journalの英断をレポートし、英国のThe Guardianもその数日後にData are or data is? (July 8, 2012)でさらに踏み込んで、dataを単数扱いにするのが正しいと発言します。The Guardianのスタイルガイドには

data
takes a singular verb (like agenda), though strictly a plural; you come across datum, the singular of data, about as often as you hear about an agendum

と説明されています。

 

■dataを単数/複数扱いにする際の注意点

学術論文と公式文書では複数扱い、それ以外では単数扱いにするというのが一番無難な線です。ただしこのルールを準拠しなくても文法的には間違いにはなりません。日常会話でdataを複数扱いにしたら「堅苦しい」印象が生まれるだけです。きちっとすべきことは一貫性を保つことです。例えば、

What is this data? The data themselves reveal…

という文は文法的に間違いになります。どこが間違いかわかりますよね。

以下、dataを不可算名詞扱いにする場合と、可算名詞扱いする場合に注意すべき点をいくつか述べます。

─manyとmuch、fewとlittle

dataを可算名詞扱いにすると、muchではなくmany、littleではなくfewを使わないといけません。不可算名詞扱いにすると逆になります。

【可算名詞の複数形】
Many data suggest that ants are drawn to chocolate.
There are very few data in this field.

【不可算名詞】
Much data suggest that ants are drawn to chocolate.
There is very little data in this field.

─theseとthis

【可算名詞の複数形】
Many of these data are useless because of their lack of specifics.

【不可算名詞】
This data is useless because of its lack of specifics.

─可算名詞のdataを単数形にする場合

可算名詞のdataは単数形が事実上なく、基数で表記できません。だから可算名詞扱いにしても、単数形にする場合はa piece of dataと表記せざるを得ません。a data pointやa set of dataでも構いませんが、a dataとは絶対言わないように注意して下さい。「2つのデータ」という時は、two dataではなく、two data setsと言いましょう。

─dataの代わりにinformation/factsを使え!

dataの用法にとまどったら、dataの代わりに不可算名詞の時はinformation (もしくはevidence)、可算名詞の複数形の時はfactsを使うという手があります。

This data is useless because of its lack of specifics. ➡ This information is useless because of its lack of specifics.
Many of these data are useless because of their lack of specifics. ➡ Many of these facts are useless because of their lack of specifics.

多少語感が変わりますが、ほとんど意味に違いがありません。

7月 3, 2018 · Pukuro · No Comments
Posted in: ■英単語豆知識

Leave a Reply