tkm2261's blog

研究員(OR屋) → データ分析官 → MLエンジニア → ニート → 米国CS PhDが諸々書いてます

【社会人学生AdC '21】退職米国PhD進のすゝめ【12/5】

お久しぶりですtkmです。今回は退職D進勢もOKとのことで社会人学生AdC '21の5日目として米国でのMS/PhDについて書いてみようと思います。

adventar.org

*私の詳細な留学模様については過去の記事をどうぞ

はじめに

この記事に来た方々は、程度の差はあれD進に興味があるかと思います。ありますよね?

無責任に言うなら、D進を迷っている人はD進したほうが良いと思います。人類のほとんど全ての人はD進なんて考えもしない中、頭によぎるだけで十分素質があります。

博士は好きな時に進学できるので、社会人を経由して一番モチベがある時に社Dや退職Dするのは理に適っているはずです。

私もこっちで結構大変でしたが「じゃあ日本に戻ってまた働くか?」と自問すると「それはねぇな。」となって色々頑張ってこられました。

変に会社で働く事に希望や妄想を持たなくて良いのは、5年と長い米国PhDで気持ちを保っていくのにとても有用です。(逆に未経験で知らなかったからこそ頑張れたというケースもありますが。)

米国退職D進という選択

社会人を経由したおっさん(おばさん)がD進にあたって一番の懸念は経済的な問題かと思います。社Dは経済的な不安は少ないですが、一方フルタイムでさえ3年で終えるのが難しい博士号取得を二足の草鞋でやっていくのは相当な覚悟と犠牲が必要になります。さらに日本での博士号取得者の待遇を鑑みるに、これでD進を躊躇わない人は少数派でしょう。

そこで米国退職D進という選択が頭をよぎります。少なくとも私はよぎりました。簡単に当時思った利点を列挙すると、

  • 給料が出る。(日本以外では当たり前ですが。)
  • 5年課程で研究のブランクがあっても大丈夫そう。
  • Ph.D.がしっかり就職でも評価される。
  • 米国で就労可能なビザが貰える。
  • 英語が運用できるようになりそう

などと、"もし"行けるなら上に挙げた諸問題は解決可能なように思えます。

これに加えて、個人的に日本での博士課程に思っていたのが、全体的に「博士課程では指導教員のテーマを離れて独自のテーマをすぐ見つけるべし」という気風が強すぎると当時感じていました。

もちろん独立した研究者を生み出すことは最終的なゴールですが、個人的には「博士号は顕著な研究成果を上げた証明ではなく、科学研究に必要な手続きを一貫して設計実施出来ることの証明である。」と思っており、教育可能な部分が大きいにも関わらず無責任な放置が容認されやすい風土に見えました。(別に学生に給料払っているわけじゃないですしね。)

そこで世界で一番の研究者を生み出すシステムを持つと言われる米国でPh.D.を取ってみようと進学しました。

「教育可能な部分は修士で学んでおくことだよねwww」という考えもありますが、これが理想論である事は周知の通りと思いますし、だからこそ米国のPhD課程は日本の修士+博士に相当する5年になっているのかと思います。これが修士 (2年) + 博士 (3年)になるか博士 (3年) + 助教 (2年) 相当になるかはその人の段階によるのだろうけど。

当然ながら、こんな想像ほど米国が美しいわけではないですし、教育部分は多分に指導教員に依存します。若干「研究の国アメリカ、その空気を吸うだけで僕は高く跳べると思っていたのかなぁ」状態だった感はあります。

ただし給料が払われてフル稼働コミットした博士が多数いる状況は、主著以外にも共著で関わって学べる場が多く、エコシステムがあるなぁという感じです。ラーメンハゲの名言ではないですが博士学生には給料が支払われるべきですね。日本に漂うアカデミックの先の見えない悲壮感みたいなのがないのはメンタルにも良いです。

さらに日本では研究室で発表して終わる小さい成果でも気軽に国際会議のワークショップレベルで発表して鍛えられる機会が多いのも教育に良いです。

日本にもこのレベルを実現する研究室があるのは知っていますが、私の知る一般的な研究室は研究へのコミット具合が不明瞭な学部修士学生が多く、頼みの博士も孤立しがちで給料払ってない分稼働も計算しづらいといった感じを受けます。これで質の高い研究・論文が減ってきているのも仕方ない気がします。

最近、教員が学務に忙殺されているという話をよく聞きますが、もしその教員の下にフルコミットした博士学生が2-3人いれば、しっかり論文は出せるかと思います。教員が多忙なのは世界共通ですし、これから博士進学が一般的になって給料も支払われるそんな未来を祈っています。

(学振とか、最近は奨学金も充実してきましたが、やはり”給料”という形をとってこそ博士学生の地位向上が実現すると思っています。)

日本人は米国PhDでやっていけるか

これは自信を持ってやっていけると言えます。日本である程度優秀であれば米国でもある程度優秀かそれ以上に評価されるはずです。米国の数学教育はお粗末なもので、学部まで数学を日本で真面目にやっていればこちらでは超優秀なはずです。さらに米国Ph.D.は学部卒業から応募できるため、社会人経験があれば新卒レベルを圧倒する経験(プログラミング等)が(きっと)あるはずです。

近年のML/CV/NLP界隈の異常な盛り上がりで「トップ会議の論文数本ないと厳しい。」みたいな言説は、実際一部では正しいのですが、こういった選考は応募者がよりどりみどりの一流大学や有名研究室での話です。

そのため、”本来は学部生が応募できる”米国Ph.D.はしっかりリーチすれば合格することは可能だと思います。例えば、ラボ立ち上げ直後の若い助教Ph.D.終えたばかりで初めて自分のお金で学生を雇う、かつその学生がしっかり卒業してくれないと自分の評価に影響するという状況だったりするので、ある程度能力があって従順でハードワークを厭わない日本人にありがちなタイプは英語が多少アレでも十分なアピールポイントになるはずです。

米国PhDは応募というより就職

米国Ph.D.は大体毎年12/15締切ですが、闇雲に出願しても超超優秀な場合や凄い推薦状が無い限り合格は出ないでしょう。MITやStanfordみたいな超一流大学は教授に応募というより最初にラボローテーションがあって所属を決めたりしますが、これは誰がどこに行ってもその教授を満足されられる基準に達する上位校に許された技で、普通の大学は教授が誰を取るかを判断します。(もちろん教授はその意思決定を委員会で承認される必要はあります。)

そのため基本的に12月中でほぼ決着はついており、それまでに各教授にどれだけリーチ出来るかという話になります。

ただこれが難しいのはよくわかります。私の出願時もこの重要性は頭で理解していても、いきなり教授に連絡を取るが怖く、日々の業務が忙しかったのもあり、闇雲に出願して結局修士経由ということになりました。

今過去の自分にアドバイスを送るとすれば、以前にツイートもしましたが、

とにかく学生を探している教授にコンタクトを取りましょう。そもそも給料を出す以上、教授も年によって学生を取る取らないがあります。しっかり求人を出しているところにリーチしましょう。

理想的には夏前に連絡をとって夏にその研究室でインターンするのが理想ですが、今はコロナで無理ですし、逆に連絡が遅くてもチャンスがある可能性があるので、この記事が出るのが12/5ですが全然遅くないので応募大学の学生探している教授に片っ端から連絡しましょう。

一方、逆説的に超一流大学のPh.D.に行きたい場合は、そこの教授に特別な繋がりが無い限りはほぼ無理なので諦めましょう。そこへの推薦状を他の大学に使った方が有意義です。それでも行きたい場合は修士から潜り込みましょう。

英語という壁

教授にコンタクトを取れても話が出来なければ意味がありません。米国では英語ノンネイティブの教授も多く(特にCS)、流暢な英語は求められない場合が多いです。ただしノンネイティブがゆえに教授も許容できるレベルもわかっており最低限は話せる必要があります。これはそこまで大層なものではなく、日本の英文法教育はしっかりしているので、落ち着いてゆっくり文法を守って話せば必ず通じます。

しかし一応目安的にはTOEFL iBTが100点でSpeakingが23点ぐらいは欲しいと言うのが実情のようです。私は91点でぶっこみましたが、100点持っていた方々は多くの合格(修士含む)をもらっていました。

私がPh.D.編入するときは指導教員から「お前の英語スコアが低いから、4月ぐらいに委員会が疲れてきたタイミングでこっそり通す。」といわれました。こんな感じでPh.D.は英語のスコアが低くても若干融通が効きますが、逆に言うと特別な事情(当時私は研究結果が出始めていた。)が無い限りは、このぐらいのスコアは欲しいところです。

詳細な情報は中国の一亩三分地に出願者のTOEFL平均が乗っているので見てみると良いです。

https://www.1point3acres.com/bbs/offer

正直な話、英語力を日本で独力で身につけて厳しいものがあります。その場合Ph.D.だけでなく修士出願も考えるとよいです。修士での優秀なGPAを取れば後のPh.D.出願でも評価され、修士の授業は移管できるので時間の無駄にもならないですし、大体の大学で米国の修士があれば英語試験免除だったりします。(ただし年間400万円ぐらいは覚悟する。)

もし漠然と米国留学を考えている人がいれば、とりあえずTOEICの代わりにTOEFLを定期的に受験すると良いです。TOEFLの点があればいざ行きたくなった時に役立ちます。

退職米国PhD出願はメンタルとの戦い

ここまで退職米国PhD進を勧めるようなことを書きましたが、そこまでの道のりは結構根性が必要です。私が受験前に話を伺った人も「結局応募まで行き着いた人は殆どいない。」と言われました。

仕事をしながらの受験準備はかなりメンタルを消費します。TOEFLGREの準備も大変ですが、一番キツイのは受かったら仕事をやめるけど周りに相談しづらいというのがあります。

普通に全落ちもありえる世界なので、その場合何事もなく仕事を続けたいので大っぴらに相談しづらい中、受かった場合に備えて長期の案件を抱え込まないようにするなど、神経を削る状態が続きます。そんな状態では生産性が上がるわけもなく、それがまたメンタルに影響するという悪循環です。

今の状態で過去に戻れるなら、早い時期から教授と連絡とって何処かは受かりそうといった状態にしたり(or見込みがないので早期に見切りをつける等)スマートに事を進められるはずです。後に続く人々には、私みたいな無駄な事をせず、どんどん先人の知恵を活かしてスマートに出願して貰える事を祈っています。

FAQ

なにか質問あればTwitterTakami Sato (@tkm2261) | TwitterにDM下さい。とりあえずよくありそうな質問をおいておきます。

  • Q: SoPとかエッセイどうすればよい?
    • A: 私も詳しくないですが、検索すれば書き方は色々乗っているので参考にして、添削サービス(EssayEdge等)に出すと良いです。送って頂ければ私も見ます。

grad.berkeley.edu

  • Q: どのぐらい出願するものなの?
    • A: 十数校とか?10校ぐらいは普通なので推薦状依頼するときは米国受験の事情を話して置くとよいです。
  • Q: 奨学金を持ってないないと駄目?
    • A: なくてもOK。基本的に奨学金的なのは他の国の学生は無い。あればプラスだけど無いからといって諦めるレベルのものでもない。
  • Q: 論文もってないと駄目?
    • A: なくてもOK。一流大学とか人気研究室に行くには必要かも。最近のCSのML/CV/NLP界隈は異常なのでなんともですが、こういった疑問は志望教授とのインタビューで直接聞いた方がよいです。(インタビュー呼ばれている時点で大丈夫かも)
  • Q: CSってやっぱ高倍率?
    • A: CSとなるとミーハー人気もあるので、志望したい教員がいるならComputer EngineeringやNetworkとか周辺コースも見ると良いかも。CS学部はお金持っているケースが多くてTA負担が低いなど良いこともあるのですが、まずは受かってから考えて、一番お金が潤沢な所に行けば良いかと。
  • Q: 英語話せるようになる?
    • A: 授業受けているだけだと駄目だけど話していれば話せるようになる。ただしSpeakingはどうにかなるけどListeningは時間かかるので日本にいるときから鍛えた方がよい。
  • Q: 英語どうやって勉強する?
    • A: TOEFLは特殊なケースなので受験勉強と一緒です。英会話については何だかんだ瞬間英作文が一番効きました。瞬間英作文を暗記してからフィリピン留学1ヶ月行くと英語話す感覚ができるかも?私は結局留学前に十分な英語力をつけられなかったので他の方々を参考にしたほうが良さそう。
  • Q: Kaggleとか競プロって役に立つ?
    • A: 無いよりはあったほうがよいand教授による。UT AustinのインタビューのときはKaggleの話になったし、ウチの指導教員は昔ICPC出たりしたのでアピールにはなったはず。

Google Cloud ML Summitで「Kaggler のための BigQuery 活用手法」を話してきた。

Kaggle chaiiコンペで2位でした&GMになりました。

Usenix Security '22で論文発表した。

Kaggle Shopeeコンペで2位でした。

お久しぶりです。

一応ブログにはなんかイベントが起きたら書いて置くことにしているんですが、

米国生活も落ち着いてきて更新が滞ってました。

今回はKaggle ShopeeコンペでLyakaapさんと組んで2位入れたのでそのご報告です。

解法解説はYoutube Liveで行ったので良ければ合わせてご覧ください。

youtu.be

個人で頑張るPh.D.学生の米国Tax Return

こんにちは。

今日は無事Tax returnが振り込まれたので、収入あるF-1学生(Ph.D.学生を想定)が個人でTax Returnをやる方法を自分の備忘も兼ねて解説します。

ちなみにPh.D.学生は基本的にお金が返ってきます。

免責: この記事はTax Returnの書類を書いた時のことを思い出しつつ書いてます。間違っている可能性があるので信じすぎず各自で確認してください。

始める前に。。。

所属する大学がSprintaxを契約していて使えるか確認しましょう。

例えばUSCなんかだと無料で使えます。私立の強みですね。

https://ois.usc.edu/living-in-la/money/taxes-2/taxprep/sprintax-tax-preparation-software/

ただこのサービス個人で使うとなると、連邦税$37.95 州税$29.95と70ドル近く取られて、少額のTax Returnで使うのは幅からられます。

他にもサービスあるかもですが、Non-Resident Alien向けは需要も少なくSprintaxぐらいかと思います。

ちなみに個人でやる場合Web提出は出来ず、郵送必須になります。

用意するもの

  • W-2: いわゆる源泉徴収票、収入がある場合は必ず郵送されてきます。控え・連邦税用・州税用の3枚綴になっているはずです。
  • 1042-S: 奨学金などの収入はコチラに記載される。こっちは多分取りに行くかWebからダウンロードします。

まず米国Taxの仕組みに慣れる

あまり良くないですが、Sprintaxは課金せずに州税連邦税の課税額を見るところまでは進めます。

アプリのインストラクションに沿って、どの書類のどの数字を使うかが理解できるので仕組みを理解するのにとても役立ちます。

州税・連邦税の額を見たら、控えておいて最後に自分で算出した金額と検算します。

提出するもの

連邦税と州税はオフィスが別なので2通封筒を用意する必要があります。

  • 連邦税: W-2, 1042-S, Form 8843 と (Form 1040-NR-EZ または Form 1040-NR) の4書類を郵送
  • 州税: W-2, 1042-S と Form 540NRと(1040-NRかEZのコピー)の4書類を郵送

Form 1040-NR-EZはEZは簡素を意味していて、扶養者がいなくて変な収入がない場合はこちらで出来ます。詳しい条件はコチラ

大体の留学生はForm 1040-NR-EZで足りるはずなので、Form 1040-NR-EZのみ解説します。

連邦税

少し古いですが、こちらのガイドがとても役に立ちます。項目番号がちょっと変わってたりするので項目名をしっかり確認しましょう。

Unofficial UWaterloo Intern USA Tax Guide

Form 8843

https://www.irs.gov/forms-pubs/about-form-8843

これは収入なくても提出必須のやつですが、Part IIIのStudentsのところを埋めればOKです。Form 1040-NR-EZに同封する場合は住所の欄は書かなくて大丈夫です。

Form 1040-NR-EZ

https://www.irs.gov/forms-pubs/about-form-1040-nr-ez

基本的に↑のUnofficial UWaterloo Intern USA Tax Guideに沿って埋めていけば大丈夫です。

1042-Sのことは書いてないですが、

  • 1042-Sの項目2のGross Incomesを1040-NR-EZの項目5の「Scholarship~」のところに、
  • 1042-Sの項目7aのFederal Tax Whitheldを1040-NR-EZの項目18aの「Federal income tax ~ 1042-S」のところに

それぞれ書くぐらいです。その他気をつけることは州税をItemized deductionで控除するのを忘れないというところですね。

公式のガイドも見つつ進めればすんなりかけると思いますが、これが厳しいと思ったら素直にSprintaxを使うことをオススメします。

州税

カリフォルニアを例に話を進めます。州税のほうが色々控除があって少し面倒です。

1040-NR-EZに書いた数字を流用するので、連邦税を終わらせてから州税を始める必要があります。

2019年度のはコチラから見ることが出来ますが、毎年その年用のがあるのでググって最新のものを見つけましょう。

2019 540NR Booklet | FTB.ca.gov

左側のRelated contentsからその年のフォームとInstructionを見ることができます。

空欄が多いですが、注意するところは

  • 項目7と11がpersonalを一人分($122)の控除
  • 項目12がW-2にある賃金収入
  • 項目13, 15, 17がW-2と1042-S合わせた総収入
  • 項目18がitemized decutionとstandard deductionの多い方。
    • PhD学生だと普通はstandard deductionのほうが大きいのです。額はググって調べましょう。
    • 2019年度は$4,537でした
  • 項目31に自分の控除後収入から課税額をInstructionにあるTax Tableから見つける。
  • 項目42が州税の課税額、多分項目31から項目7を引いた額になってるはず。
  • 項目81, 87にW-2にある収税の源泉徴収額を書く。
  • 項目125に源泉徴収額と実際の課税額との差を書く。(普通はRefundのはず)
  • 連邦税の書類も添付しろとあるので、1040-NR-EZのコピーをつける。

初めてやるとstandard deductionとTax Tableのところが面倒ですが、それ以外はすんなりと行くと思います。日本の確定申告やったことアレば似たようなものです。

郵送する

Sprintax上の課税額と一致したら署名して提出をします。

残念ながらNon-Resident AlienはWeb提出できないので郵送します。宛先住所はググれば出てきます。

Trackingはしたほうが良いとは思いますがPriority Mailが$8ぐらいするので、少額の場合は通常郵便のFrist-class Mailで良いかと思います。ここら辺は好みです。

最後に

上記の通り結構面倒なので周りだとSprintaxを課金したり、税理士に頼んだりしてしまっている人もいます。ただ1回慣れれば簡単なので毎年70ドルの節約になるのでオススメです。調べた限り日米租税条約周りの免税は厳しそうなので大人しく普通にやるのが良さそうです。あとインターンとかに行って収入が増えると、記入する額や項目が増えると思います。

kaggle Tweet Sentiment Extractionコンペで5位でした。

解法 (英語)

www.kaggle.com

解法(日本語)

チーム組んだguchio3さんの記事

guchio3.hatenablog.com

解説動画

www.youtube.com