DaSiC 7 (2023) Linguistics and Data Science in Collaboration 発表資料

Copyright (C) 2023 Shinichi Asakawa
Shin Aasakawa, all rights reserved.
https://opensource.org/license/mit/

Google colaboratory について

近年,このような仮想計算機上で実行するクラウンドコンピューティング環境は,Google colaboratory のみならず,複数の実行環境が提供されています。 有名なところでは,以下のサービスが挙げられます:

アマゾンのクラウドコンピューティングサービス AWS,統計解析で人気のある Rstudio Could ,文書作成 $\LaTeX$ 環境 Overleaf, MATLAB 実行環境 MATLAB online

Google colaboratory は,Google アカウントさえあれば,無料で実行できます。 ただし,GPU の計算機資源をより高度に利用したい場合は,月額課金制度 (サブスクリプション) に申し込むことで可能となります。

Google colaboratory 使用上の注意

注意点としては,仮想コンピュータ上で実行されるため,90 分何もしないでおくと,仮想コンピュータとの接続が途絶えてしまいます。 切断されて記録が残らないよりは,Google Drive にコピーを保存しておいた方が,便利です。 そのため,本ワークショップでは,利用者各自で,自身の Google Drive に保存されることをお勧めいたします。

その他のスペックは以下のとおりです:

Q&A

簡単な操作方法

Google の Q&A オリジナル https://research.google.com/colaboratory/faq.html

Google codelaboratory は械学習教育研究用ツールです。 環境構築に必要な事前のセットアップが不要なjuypter notebook 環境です。

Google Colaboratory は大抵のブラウザで動作します。動作テスト済ブラウザは, ChromeFirefoxです。

無料です。

Colaboratory はオープンソースのジュピター(Jupyter) を元にしています。 ジュピターノートブック(Juypter notebook)を他のユーザと共有することができます。 ローカルな環境に対する,ダウンロード,インストール,実行,などは必要ありません。

2014 年に jupyter 開発チームと我々は本ツールの初期バージョンを共同で開発していました。 以来 colaboratory は発展し続け,グーグル内部用途となっています。

Colaboratory ノートブックは Google Drive に保存されます。 Google Docs や sheets と同様にシェア可能です。右上のシェアボタンを押してください。 Google Drive の ファイル共有の手引き に従ってください。

Notebook のシェアを選択すると,テキスト,コード,出力という noteobook の全内容が共有されます。 コードセルの出力を抑制させることは可能です。出力をシェアするには,保存時に 編集 > ノートブック設定 > コードセル出力の抑制 を選択してください。 仮想環境の使用時は,使用時の設定ファイルやライブラリはシェアされません。ですので,ライブラリのインストールやカスタマイズをセル内に含めておくと良いでしょう。 librariesfiles を参照してください。

変更の反映は即時に全員へなされます。グーグル Docs の編集結果が編集中全ユーザに視認可能なのと同様です。

できます。ファイルメニューからノートブックのアップロードを選んでください

Colaboratory は,Python バージョン 2.7 と Python バージョン 3.6 をサポートしています。 これら以外の R や Scale といったジュピターカーネルの使用を希望するユーザがいることは承知しています。 将来的にはサポートするつもりですが,時間の制約が実現していません。

検索ボックスのドライブを選んでください。 左上にある colaboratory のロゴをクリックすればグーグルドライブ上の全てのファイルを閲覧できます。 ファイル->最新のファイルを開けば,最近閲覧したファイルを開くことができます。

コードは仮想マシンで実行されます。仮想マシンはしばらく放置するとリフレッシュされます。 仮想マシンがリフレッシュされるまでの最長寿命はシステムに寄ります[^2]。

colaboratory 上で作成したノートブックをグーグルドライブからダウンロードできます。 instructions や colaboratory のファイルメニューの中を御覧ください。 colaboratory ノートブックは,オープンソースのジュピターノートブック形式(拡張子 .ipynb) で保存されています。

colaboratory はインタラクティブな利用を想定しています。バックグラウンドで GPU を長時間実行すると停止させる場合があります。 colaboratory を仮想通貨のマイニングに使わないでください。仮想通貨マイニングはサポート対象外です。 長時間の継続利用に際はローカルランタイムeを推奨しています。

“ランタイム” メニュー内の “全てのランタイムをリセット” は割り当てられた管理下の全仮想マシン に対して実施されます。これは仮想マシンに不都合があった場合,たとえばシステムファイルを誤って上書きしてしまった場合など,に有効です。 colaboratory は計算資源を消費するこのような事態に制約を課しています。このような事態が発生したら,しばらく待ってから再試行してください。

colaboratory を開いて,「ヘルプ」メニューから「フィードバックを送る」を選んでください