「C」の茶の国から「T」の茶の国へと、本当に違う種類の国へ行くことができるのかデータ分析
イントロダクション
バックパッカーのバイブル沢木耕太郎の深夜特急で、ハナモチ氏という人物がお茶について語っているシーンが有る。
手元にある文庫版の第5巻を確認するとこんな一節である。
「彼らはTで始まるチャイを飲んでいる。でも、僕たちはCのチャイを飲んでいるのさ」
中略
私はトルコからギリシャに入ることで、アジアからヨーロッパへ、イスラム教圏からキリスト教圏へ、茶の国からコーヒーの国へ、「C」の茶の国から「T」の茶の国へと、違う種類の国へ来てしまっていたのだ。
というようにユーラシア大陸を東から西に行くとお茶の名前がChaからTeに変わるのだ。
北京語でお茶のことをチャーと発音するように、中国から陸路で伝わった茶はトルコまでCha系の発音で呼ばれることになる。
ではTeの方はというと、オランダがお茶を輸入した福建省あたりのビン南語ビン南語ではお茶のことをテーと発音するようで、そのオランダが海路で運んでいたため、オランダの植民地やヨーロッパ諸国ではお茶のことをティーやテーなどの発音表現する。
というわけでこのどこの国がCha系の国で、どこの国がTe系のなのか、テクノロジーを駆使して調べてみた。
調査方法
Googleスプレッドシートの翻訳関数
Googleスプレッドシートの関数に、GOOGLETRANSLATEというものがあり、日本語から英語へなど翻訳を行ってくれる。
例えばこんな風にセルにかいてあげると
=GOOGLETRANSLATE("tea","en","ja")
お茶と出力される
この関数の変数はそれぞれ
- 訳したい文字
- 翻訳元の言語2文字の略称
- 翻訳先の言語2文字の略称
となっている。つまり各言語のこの2文字のコードを片っ端から調べて、英語のteaから翻訳してやれば良いのだ。
この機能を知ったきっかけはサンミンさん@gijigaeのこのツイート
グーグルシートで簡単翻訳🇯🇵🇬🇧。スプレッドシートのセルに、関数を入れるだけです。入れるのはこんな関数。
— Sangmin @ChoimiraiSchool (@gijigae) 2019年4月2日
▼英語を日本語に訳す場合
=googletranslate(訳したいセル, "en", "ja")
▼日本語を英語に訳す場合
=googletranslate(訳したいセル, "ja", "en")
文章を訳すことも出来ます☝️。 pic.twitter.com/aysuzBAyVX
このツイートを見て各言語ごとにChaかTeか調べることができると思ったのがこの調査を始めたきっかけである。
ISO 639-1 言語を2文字表現
さきほどの2文字のコードは何かというと、国際規格のISO 639-1であるようだ。 このISO 639-1のリストをWikipediaから引っ張ってきた。
そして翻訳した結果はこちら docs.google.com
表の中で#VALUE! となっているのはGoogle翻訳が対応していない。すべてのISO 639-1で定義されている言語にGoogle翻訳は対応していないようだ。
この結果ISO 639-1の言語184言語中、101言語の翻訳できた。
というかGoogle翻訳って101言語対応してるの?すごない!!
ここまでの結果により翻訳に対応していない言語をフィルタリングできる。
Google翻訳ページ
Google翻訳のページでは、メジャーな言語はその翻訳とともに発音を再生してくれる機能が存在する。
またGoogle翻訳のページのURLは、ISO 639-1コードと翻訳したい文字をURLに含めることで動的に生成できる。
このようにセルを設定する
=concatenate("https://translate.google.com/?hl=ja&op=translate&sl=en&tl=", D77,"&text=tea")
するとGoogle翻訳のリンクを作ることができる
https://translate.google.com/?hl=ja&op=translate&sl=en&tl=ja&text=tea
forvo.com
forvo.comは各地の言語の単語の発音を登録できるサービスでありこちらもURLを動的に生成できる。
こちらもこのようにセルを設定する
=concatenate("https://forvo.com/word/",E77 ,"/#", D77)
するとforvo.comのリンクを作ることができる
https://forvo.com/word/お茶/#ja
それぞれの音声をすべて耳で聞いてChaかTeかを振り分け
それぞれの音声をGoogle翻訳で発音を再生できなかった場合はfevor.comで音声を確認した。 聞いた音声を元に下記のカラムを追加した。どちらにも音声がないものは今回は対象外とした。
- 聞いた音声にフリガナ
- ChaかTeかを分類
- 音声がチャに近い音で発音されるか、テに近い音で発音されるかそれぞれ分けた
- 話されている国をラベリング
- 各言語が話されている国がどこかを荒く調べて、それぞれ独立したデータとした
※ 話されている国のラベリングは、南北のアメリカ大陸で話される英語やスペイン語、ポルトガル語については茶の伝来について分布を見る際にノイズになるので英語はイギリス、スペイン語はスペイン語、ポルトガル語はポルトガルだけにしてある。
このあたりはデータ分析と言うよりは根性である。
振り分けした一例
結果
データを地図上にプロットすると以下のように、Chaの国、Teの国、 ChaでもTeでもないその他の国を作成した
Chaの国とTeの国
青がChaの国、赤がTeの国
グラフの濃淡は、対象の言語の種類が複数あると濃くなる
ChaでもTeでもないその他の国
考察
ChaやTeについて
冒頭の深夜特急の引用文のように、トルコでChaの国が終わり、ギリシャからTeの国々になるのがデータをプロットした地図から分かる。
ヨーロッパはだいたいTe系統で、その他の国々はだいたいCha系統。
しかし東ヨーロッパの国々は結構Chaの国であった。これは意外でイメージだとギリシャでバッツリTeの国だと思っていた。
南インドやその近くのスリランカではなされるタミル語はお茶のことをテニーと発音し、インドはChaの国でありTeの国でもあることがわかった。
Teの国は海路で茶が伝わったとされるが、インドネシアや、南アフリカ、ナミビアはかつてオランダの植民地だった影響でTeの国なのだと思われる。先程のタミル語が話されるスリランカもオランダの植民地だったのでTeの国であるのだろう。
Teの国だと思っていたヨーロッパの中でもポルトガルはChaの国
ポルトガル語はChaの国でお茶のことをチャと発音する。
ポルトガルは植民地のマカオから茶を輸入していたので、広東語の茶とおそらく同じ音で伝わったものだと思われる。 (これは友達の @Y_Hirano が教えてくれた。多謝)
ウィキペディアの茶の項目にも書かれている(出典は無いが) ja.wikipedia.org
Chaの国で話されるお茶の発音は大体チャイ
各言語の音を直接自分の耳で聞いてフリガナを振っていくと、Chaの国86ヶ国中、32ヶ国がチャイと発音し37%の国がお茶のことをチャイと発音する。
特に東西問わずアジア圏でチャイが多く、アジアのカフェやレストランではチャイと言うとお茶が出てくる可能性が高いのでぜひチャレンジしてみてほしい。
お茶をチャイと発音する国一覧
ChaでもTeでもない国が存在する
ChaでもTeでもない国がいくつかあった。
ポーランド語はのお茶を表すherbata(ハルバータ)はラテン語herba theaが語源らしい herbata - ウィクショナリー日本語版
そのラテン語herba theaはそれぞれ
- heabaが草 herba - Wiktionary
- theaが茶 thea - Wiktionary
リトアニア語のお茶を表すarbata(アルバータ)はリトアニアはポーランドに隣接しているので文化圏が近いためポーランド語がなまったものだと思われる。
ソマリア語のお茶を表すshaahはfevor.comにもGoogle翻訳にも存在しなかったので特別にyoutubeで検索してみるとソマリア語で喋っている動画にshaahを発音しているものを見つけた。
https://www.youtube.com/watch?v=BAAt03W2z7g , https://www.youtube.com/watch?v=1lz87j-pKwM
これら2つの動画からどうやらshaahはシャーと発音するらしい。
今回はアラビア語の茶、”シャーイ”はChaの国と分けている。字面で見るとChaじゃないじゃないかと思うだろうが、音を聞くとTeかChaかどちらかで分類するとCha寄りだと判断した。
アラビア語のシャーイがなまってソマリア語はシャーであろう。広義の意味ではChaの国としても良いかも知れない。
その他、今回の調査でわかったこと
- アラビア語が話される国がたくさんある。英語、中国語、スペイン語は世界の話させている人口カバー率が高いが、アラビア語はその次ぐらいだろうか
- Google翻訳はインドの方言がたくさん対応している
- Google翻訳は英語、ウェールズ語、アイルランド語、スコットランド語とイギリスの4つの国の言語に対応している
- Google翻訳が対応している言語は、話される人口が数千万人以上いる言語と仮定すると、インドやインドネシアの言葉が多く対応されれているのもの納得である
- というかGoogle翻訳すごない?
じゃーねー。ロケットビーバーイ
給湯器が家の外にある北限の町はどこなのか長年の疑問をGoogleストリートビューで調査
給湯器が家の外にある北限の町はどこなのか人生で一度は気になったことはあるよね?オレはある
オレの故郷の北海道は室内の洗面所にあり、住んだことのある東京や神奈川、茨城でも給湯器は外にあった。
おそらく積雪量も関係しているだろうが、雪の少ない太平洋側を対象に仙台からと青森からの南北から絞り込んで調査していった。
調査方法はGoogleストリートビューを駆使してなんの変哲もない住宅街を確認していくという根気のいる作業をしていった。
以降は探しながらツイッターに書いていたものをそのまま乗せるのでライブ感を楽しんでもらいたい。
給湯器を室内に置く南限はどこなのか問題。
— コンユウ (@kon_yu) 2020年1月23日
北海道は室内の洗面所にある
まずは南から仙台。
仙台給湯器あり。前に聞いた話だと仙台のばあちゃんの家は中にあるけど、そいつの家の給湯器は外にあったような気がするって話。 https://t.co/xm7vXC8mxj
次に盛岡
盛岡でも外に給湯器があるのを発見した。 https://t.co/GHkAVYp4na
今度は逆に青森市から、無いのを探すのはけっこう大変だ、探すのを止め時がわからない
青森市まで行くと、給湯器が屋外になさそうだ。 https://t.co/Zot9UYlENl
だんだんストリートビューで給湯器を探すコツがわかってきたぞ 一軒家の給湯器はだいたい正面にので道路沿いの画像のストリートビューでは探しにくいが、アパートなどの集合住宅は正面のドア横辺りにある
だんだんストリートビューで給湯器を探すコツがわかってきたぞ
— コンユウ (@kon_yu) 2020年1月23日
一軒家の給湯器はだいたい正面にので道路沿いの画像のストリートビューでは探しにくいが、アパートなどの集合住宅は正面のドア横辺りにある
っていう謎のコツを掴んできた。
八戸でもなかった。(外)盛岡 => x > (内)八戸 絞れてきた。 https://t.co/csoizwXVQz
二戸にもなかった。もう少し南下する
田舎のほうが家が家離れているのでストリートビューから家の裏の方を探しやすい https://t.co/QS1z0vClp2
八幡市にも給湯器は外にはなさそうだ。 っていうか外に置く灯油のタンクがあるところは灯油ストーブを焚くぐらい寒いから給湯器は外になさそう https://t.co/bkxuP6ym2v
八幡市の東にある岩手町にもなさそう https://t.co/TZ04CSvptv
やっぱも盛岡には給湯器がある https://t.co/EUlkHfVsME
盛岡には外に給湯器があった。
結論: 今回の調査では給湯器が家の外にある北限は岩手県盛岡市!!
この結論を盛岡仮説として学会で発表したいと思う次第である。
#2020年やりたいことリスト を作ってみた ~ 2019年の達成度を添えて
2019年総評
2019年の目標はざっくり60~70%達成しただろう。本ポストの下方に2019年の目標達成度詳細として細かく書いてある。
大きなトピックとしては結構外国に行った。仕事とプライベートを合わせてマレーシアに1回、中国香港に1回、フィリピンに2回、ベトナムに1回と計5回に行った。 そのうち7月からフィリピンのセブ島で1ヶ月英語留学をして発音を鍛えた。そのおかげもあって英語を使った小さい仕事を2件こなすこともできたし、英会話力も上がったおかげで海外旅行がより楽しめるようになった。 年末に行ったセブ島では、ホテルでお湯が出ないで内線をかけるなんて言う英会話教材のような事が起こり、勉強したかいもあって内線でコミュニケーションをとることができた。
ざっくり仕事面だと高い波が二回来ている。フリーランスになってこんなに忙しいのは初めてかも。
- 3月から6月ぐらいまでは仕事がすごく忙しいかつストレスフルで大変だった
- 7月から9月ぐらいまでは、英語留学中に減らした仕事量を帰国後もそのまま維持したのでゆっくりできた
- 10月から12月まで、とくに11月、12月は週に6日働く必要が生じて大変だった。
2020年の目標
さて今年の目標の前に、去年は秋ごろまで目標を見直さなかったので、カレンダーにこのブログポストを見直すリマインダを季節ごとに入れた
去年はマネジメントする割合が多かったので今年はもう少し減らしたい。またサーバレスや上級者のiOS開発など新しいことをの触りはできたのでもっと深めたい。
2週間単位の旅行を3回ぐらいしたいので関係者皆様はご協力の程よろしくおねがいします(※こういうのは我を通せるぐらい成果を出さなきゃならんのでがんばろう)
仕事
- サーバレス
- サーバレスの仕事をしたいが、どうもオレオレ構成な気がしてしまう
- できればサーバレスで仕事をしている案件に入ってノウハウを学びたい(通常の単価より値引きするから)
- データ中心設計
- データ分析基盤作成から、分析の仕方のコーチングまでをワンストップで提供したい
- 外貨を少しでも稼ぐ
- 去年は日本の会社からの仕事だけど、英語を使った仕事をすることができた
- 今年もこれに挑戦する
- デザインを外国に発注する
- 99designを使って英語でコミュニケーションしたい
- iOSアプリを個人的に作る
- 語学学習関係の音声再生機能がベストのものがないので自分で作りたい
- Speechフレームワークや音声関係技術を使うことになりそう
- SaaS勉強会を開く
- やるやる詐欺をていたたので、今年こそやるぞー
学習
- 英語にコミットしていく
- 去年はフィリピンに英語留学したして割と英語で会話ができるようになった。しかしいまの現場でネイティブレベル同士が英語で喋っているとぜんぜんわからない
- 今年はTOEICの高い点数をさくっと取ってしまいたい
- 英語を処理するスピードを上げる
- はるじぇー☁(@HAL_J)さんが年始に学習相談を受け付けてくれていたので、申し込んで推薦図書や勉強の仕方を教えてもらった(超おすすめ)
- オレは英語は基本的に一定レベルまでは日本で勉強できると思っているので彼もその考えを持っていて働きながら英語を勉強したいならこれがベストだろう
- 資格
- 今年こそAWSの資格取ろう
- 計画表を作るところから始めよう
生活
- 健康に重課金する
- 去年の年末に自宅の仕事部屋のリプレースを行った
- スタンディングデスクを買った
- 腰痛防止する椅子を買った
- パーソナルトレーニングを申し込んだ
- めちゃめちゃ高かったが清水の舞台から飛び降りた
- 近年痩せにくくなってきた、10代20代のようなトレーニングの仕方では減らない、痩せ方、鍛え方を覚えれば今後も継続できるだろうと考えた
- 食事の改善も面倒なの仕組み化した
- パーソナルトレーニングの問診で毎日どのように食事をしているか聞かれたときに自分があまりにもいい加減な食生活をしていたうまく説明できなかった。つまり腹が減ったら適当に食べるなど。
- 細かいメニューなどを考えることが面倒なのでHuel - 完全栄養食やMuscle Deli マッスルデリを購入した。とくにマッスルデリは高いのでどういうものがメニューに有るのかや量を学べれば自炊可能かなぁと思っている
- 去年の年末に自宅の仕事部屋のリプレースを行った
- 北海道セカンドハウス計画を推し進める
- AirBnBに貸すことのできる賃貸を借りて普段は貸して、使うときには自分で住むようにしようかと思っている
- 収益はプラスマイナスゼロであればいいかな
- AirBnBに貸すことのできる賃貸を借りて普段は貸して、使うときには自分で住むようにしようかと思っている
- 東南アジア以外への旅行を増やす
- 2020年にオープンするミュージアムに行く
- シンガポールのプラナカンミュージアム Peranakan Museum
- 北海道白老町のアイヌの資料館ウポポイ(民族共生象徴空間) NATIONAL AINU MUSEUM and PARK
- 荒俣宏のコレクションを見たい角川武蔵野ミュージアム
- 太陽の塔の中に入りたい「太陽の塔」オフィシャルサイト(大阪府日本万国博覧会記念公園事務所)
- 環境問題に対するアクションも増やす
- まずは寄付していきたい
2019年の目標達成度詳細
仕事
- AWSもうチョットデキルようになる
- 達成率: 100%
- チョットはできるようになった
- サーバレス
- 達成率: 20%
- Amplifyでちょっとサンプル動かしたりはできた
- 今年はサーバレスで新規案件できそう
- エンジニアコミュニケーションの講座を開く
- 達成率: 0%
- 自分のチーム内で手一杯だった
- リモートワークのことを何かしらの媒体に発表する
- 達成率: 10%
- リモートワークで技術書展へ申し込んだが落選してしまった
- 自宅の仕事場周りのものを年末に購入したので全部整ったらリモートワーク含めブログに書こうと思う
- 1ドルでいいから日本円以外の仕事をする
- 達成率: 70%
- 外貨は稼いではいないが、英語を使った小さい仕事を2件行った
- インドのオフショア案件がおかしくなってるので現地の会社とチャットでやり取りして品質を調査する
- 海外のIoT事例をネットで調査してドキュメントにまとめる
- 海外のクラウドソーシングの仕事の調査はUpworksで調べてみた結構ひどい案件がいっぱいあった
- 仕事でモダンなiOSを書く
- デザイン、フロントエンド、バックエンドが疎でありコミュニケーションしやすいアーキテクチャを提示する
- 達成率: 30%
- なんとなくは出来てるがそれを100%実践できる仕事はまだできてない
- ストック型のビジネスにも挑戦する
- 達成率: 0%
- 全然できてない
- 自分のHPをリニューアルする
学習
- 今年も英語学習に力を入れる
- 達成率: 100%
- セブに1ヶ月短期留学した。みんチャレを使って毎日英語を勉強している
- Rubyの資格を取る、情報処理安全確保支援士の資格を取る、AWSの資格を取る
- 達成率: 0%
- 資格系なんもしてない。一個ぐらいとってもよかった
- iPadだけで開発できるよう工夫する
- 達成率: 50%
- Cloud9は試してみた、他のものも試したい
- DDDとクリーンアーキテクチャの本を読む
- 達成率: 100%
- 読むには読んだ、次はこれを踏まえた上で実践だ
- コンピュータの古典の積読を潰していく
- 達成率: 0%
- 古典は全然読んでない
- オンライン勉強会を開く
- 達成率: 0%
- 企画すらできてない
- Meetupに参加して英語でなんか発表する
- Touch Designerを勉強してインスタレーションを作る
- 達成率: 80%
- 初心者向けワークショップに参加した
- ワークショップで使ったデータをもとにちょっとしたものを作ってみたが、どこにも公開してない
- STEAM教育のAのArtについて学びを深める
- 達成率: 100%
- 2019年はアート思考の本が日本でも何冊か出たので幾つか読んだ
生活
- 北海道にセカンドハウス計画を進める
- 達成率: 100%
- 観光シーズンでもなんでもない10月に北海道で2週間AirBnBを借りて住んでみたところ、普通に快適だった
- ワーケーションを増やす
- 達成率: 100%
- GWにマレーシアのクアラルンプールとマラッカに行った、プラナカン文化に触れられた
- シンガポールのプラナカン博物館は今年リニューアルが完了するので終わったら観に行く
- 確定申告を速攻終わらせる、そろそろ税理士との契約を考える
- 投資信託に毎月機械的にぶっこむ
- SNSの依存度を下げる
- Maker Faire Tokyoなどに子供やITリテラシーの低い人でも楽しめるものを作って出す
- 達成率: 50%
- Maker Faire Shenzhenには参加した
- 毎月確定申告の準備をする
- 達成率: 0%
- また溜め込んでしまった
- プラスチックオーシャン対策や食糧問題にも何か小さいアクションを起こしたい
- 達成率: 100%
- そういう団体に寄付をした