言語変化・変異研究ユニット Language Change and Language Variation Research Unit

トピックス

小川芳樹氏が、「名詞に付随する節内での主格主語と属格主語」の過去130年間の頻度変化についての独自調査の結果を公開しました。

2018.9.30

データセット(A)のソースは1890年代から2010年代までの130冊の刊行物であり、その内訳は、「新書・教養書(45冊)」「小説・随筆(57冊)」「自伝・伝記(28冊)」です。130年間の変化を、本の出版年別、本の著者の生年別に示したデータについては、Excelファイルをこちらからダウンロードできます。ここには、5つのシートが含まれますが、それぞれ、(1)構文ごと、出版年ごとの頻度変化、(2)属格主語総数に占める、各構文内での属格主語の割合(出版年別)、(3)著者の生年ごとの頻度変化、(4)属格主語総数に占める、各構文内での属格主語の割合(著者生年別)、(5)130冊の本のリスト、となっています。
 
データセット(B)は、Ogawa (2016)(本研究ユニット・第3回ワークショップ口頭発表)で示したもので、そのソースの内訳は、1900年代から2000年代までの110年間の小説28冊(その大半は、上記の「小説・随筆(57冊)」と重複)です。その中から抽出した「名詞に付随する節内での主格主語」3809例と、「名詞に付随する節内での属格主語」3510例の、100万字あたりの頻度の変化を示したグラフについては、こちらをご覧ください。また、その年代ごとの頻度については、こちらをご覧ください。
 
Yoshiki Ogawa opened to the public the original data on the diachronic change in the frequency of Nominative and Genitive subjects in adnominal clauses in the last 100 years or so.
 
Dataset (A) is based on 130 books published between the 1890s and the 2010s, which are composed of 45 volumes of cultivating book (the so-called "sinsho" in Japanese), 57 volumes of novels or essays, and 28 volumes of (auto-)biographies. You can download the Excel file of the dataset A from here, in which you can see five separate sheets: (1) the diachronically changing frequency of the GSC per million characters (sorted by the year of publication); (2) the diachronically changing ratio of GSCs in a particular construction to all the GSCs (%; sorted by year of publication); (3) the diachronically changing frequency of the GSC per million characters (sorted by the birth year of the author); (4) the diachronically changing ratio of GSCs in a particular construction to all the GSCs (%; sorted by birth year of the author); (5) the list of the 130 books from which data were extracted. 
 
Dataset (B) was opened to the public in Ogawa (2016), a paper read at the 3rd Workshop on Language Change and Language Variation. You can see the PDF file here, which shows a diachronic change in the frequency of Nominative and Genitive subjects in adnominal clauses per million characters between the 1900s and the 2000s. The dataset (B) is based on 28 novels. For this presentation, Ogawa collected 3809 examples of Nominative subjects in adnominal clauses and 3510 examples of Genitive subjects in adnominal clauses.