「昔はVBでサクサクっとツール作ってたんだけどなぁ」
そう呟くあなた、私も同じです。
会社や趣味でVB(Visual Basic)をいじっていた世代にとって、最近のプログラミング界隈はまさに浦島太郎状態。Python?AI?クラウド?GitHub?… これらの単語は耳にするし、知ってるふりもできる。
でも、その一つ一つが具体的に何を意味し、どう繋がって、私たちの開発にどう影響するのか、本当の意味で細かいところまでわかっていない。
今さら誰に聞けばいいのか、そんなモヤモヤを抱えていませんか?
実は先日、ある疑問が湧いたんです。
「最近話題のAIやクラウドツールを使って、ちょっとしたデータ処理や自動化、あるいは新しい技術を使ったツールって作れないかな?」と。
昔ならVBで解決策を模索したでしょう。
しかし、世の中はAI全盛期。もっとスマートに、もっと色々なことができるはず!
そんな漠然とした思いから、Geminiに片っ端から質問をぶつけまくりました。
そしてたどり着いたのが、現代の開発環境と、かつてのVB経験が意外な形で活かせる道でした。
目次
第一章:現代プログラミングへの扉
疑問の始まり:新しい技術で、何か便利なものって作れるの?
私の最初の疑問はシンプルでした。
「テキストから音声ファイルって、Geminiで直接作れる?」
Geminiの答えは「直接は作れないが、テキスト読み上げ(TTS)サービスを使えば可能」。
なるほど、やっぱり専門のサービスがいるんだな。
次に「Google TTSを使うにはどうすれば?」と聞くと、Geminiは複数の選択肢を提示してきました。
- Google Cloud Text-to-Speech API(開発者向け)
- Google翻訳の音声出力機能
- Googleドキュメントの読み上げ機能
私の目的は「テキストファイルから自動で音声ファイルを作る」ことだったので、開発者向けのAPIが本命だと直感しました。
しかし、そこでまた疑問が。
「ドキュメントを読み上げて、音声ファイルにできるの?」
Geminiは「Google Cloud Text-to-Speech APIを使えば可能」と断言。
ただし、「開発者向けだからプログラミング知識が必要」と。
ふむ、ここからが本番だぞ、と。
Pythonとの出会い、そして馴染みのない言葉の壁
APIを使うにはプログラミングが必要。
そこでGeminiが推奨してきたのがPythonでした。
「Pythonって、プログラム言語だって名前はしってるけど、具体的にどんなもの?」
私が最初に抱いた率直な疑問です。
VBしか知らない私にとっては、未知の言語。
GeminiはPythonの概要を、VBと比較しながら説明してくれました。
- 「シンプルで読みやすい構文」
- 「汎用性が高い」
- 「豊富なライブラリ」
- 「インタプリタ言語」
特に「豊富なライブラリ」という点は、現代のAIやクラウドサービスと連携する上で非常に重要だと後に分かりました。
そして「インタプリタ言語」。
VBAがまさにそうだったので、これはとっつきやすいかも、と少し安心したのを覚えています。
第二章:理解を深める旅路
環境構築の洗礼(?)と、あの苦い記憶が蘇る!
「じゃあ、Pythonでどうやって音声ファイル作るの?」という問いに対して、Geminiは「Google Cloud Text-to-Speech APIでの作り方」を具体的に教えてくれました。
まず、Google Cloud Platform(GCP)でのアカウント作成やAPIの有効化、そして何やらJSONファイルのダウンロードが必要らしい。
そして、私のMacにPythonの環境を構築する手順。
ここで出てきたのが「Homebrew」や「仮想環境」という言葉。
HomebrewはMac用のパッケージマネージャー、要するに「Macにいろんなソフトを入れるのを楽にするツール」ですね。
これはすでに私のMacに入っていたのでクリア。
しかし、「プロジェクトごとの仮想環境」という言葉に引っかかりました。
「プログラム作る度にPythonをインストールし直すの!?」と焦ったんです。
Geminiの丁寧な説明で、ここで私のDLL地獄の記憶が蘇りました。
「仮想環境では、Python本体とそのプロジェクトで必要なライブラリだけ入れる」 この説明を聞いた瞬間、「ああ、あのDLLのバージョンが衝突して、せっかく作ったアプリが動かなくなる地獄!あれを避ける仕組みなのか!」とすとんと腑に落ちました。
Pythonの仮想環境は、VB世代の痛みを理解してくれる優しい仕組みだったのです。
これは、地味だけど意外とありがたい。
聞いたこともあり使ってはいるが実はよく知らない:JSONとBash、そしてターミナル
環境構築を進める中で、さらに謎のキーワードが登場します。
- JSON:PythonがGoogleのAPIとやり取りする際に必要となる「認証情報」がこの形式だとか。
「XMLで定義する設定ファイルみたいなもの?」と聞くと、「XMLよりも簡潔で、現代のデータ交換の主流」だと教えてくれました。
確かにXMLより見やすい! - Bash:ターミナルで使うコマンドの多くがこれだとか。
「Windowsのコマンドプロンプトと同じ?」と聞くと、まさしく「Mac/Linux版のコマンドプロンプト」だと。
納得です。 - MacのターミナルとBash/Zshの違い:「ターミナルは箱、Bashはその中の道具」という例えで一発理解。
私のMacがZshが標準なので「Bashを覚えるよりZshを知った方がいい?」と聞くと、どちらも重要だけどZshはBashの上位互換で、Bashの基礎は共通で活きる、と。
第三章:最適なツールの選択
Python vs. Java vs. PHP vs. GAS:どの言語が「最適」なのか?
「Pythonが便利なら、なんでもPythonで作ればいいんじゃない?」
素朴な疑問ですよね。
Geminiは、それぞれの言語の得意分野を説明してくれました。
- JavaとPHP:私の理解はほぼ合っていました。
Javaは大規模システムやAndroidアプリ、PHPはWebのバックエンドのデファクトスタンダード。 - Pythonが苦手なこと:高速処理が求められる(C++やJavaの領域)、ネイティブなデスクトップアプリやスマホアプリ、Webのフロントエンド(JavaScriptの領域)。
そして、ここで登場したのがGAS(Google Apps Script)でした。
「GASはJavaスクリプトだよね」と聞くと、まさしくその通り。
VBAがExcelを操るように、GASはGoogleスプレッドシートやGmailなどを操るためのJavaScriptベースの言語だと。
「GASからもGoogle TTS使える?」 使えることは使える、と。
しかし、Pythonの方が「専用ライブラリが充実しているから楽だよ」と明確にアドバイスしてくれました。
JSONの扱いやファイル保存のしやすさなど、細かい部分での手間が違う、と。
終章:新たな一歩を踏み出すために
一連の対話の結果、私の中で明確な道筋が見えました。
結論として、今回の「テキストからGoogle AI音声でファイルを作る」という具体的な目的はもちろん、それ以外の様々なデータ処理や自動化、そして最新のAIやクラウドサービスと連携したツール作成には、Pythonが最適な選択肢の一つです。
- Python:Googleなどのクラウドサービスが提供する強力なAI/ML(機械学習)APIを、最もシンプルで効率的に操れる言語です。
データ処理、高度な自動化、AI活用といった現代的なニーズに非常に強い味方となります。 - シェルスクリプト:Pythonのプログラムを起動するための「スイッチ」であり、これを活用すればテキストファイルを指定してコマンド一発で処理を実行したり、他の自動化と組み合わせたりできるようになるでしょう。
- VS Code:Pythonのコードを快適に書き、さらに「面倒くさい」と感じたGit/GitHubの操作をマウスでポチポチと直感的に行える最強の味方です。
- GitHub(Git):個人利用でも絶大な恩恵がある「コードのタイムマシン」。
DLL地獄の苦い記憶を持つ我々には、この自動バージョン管理とクラウドバックアップは、心の安定剤になります。
昔VBでコードと格闘した日々を知っていて、今は全くプログラムを書いていない皆さん、きっとこの「現代のプログラミング環境」なら、新たに便利なプログラムを作るのにも、この仕組みの恩恵を最大限に享受できるはずです。
最初は新しい言葉や概念に戸惑うかもしれませんが、一歩踏み出せば、その先に広がるAIや自動化の世界は、きっとかつてプログラミングに熱中したあの頃のワクワク感を思い出させてくれるでしょう。
さあ、一緒にコードと戯れる準備を始めませんか?
私も、昔を思い出して取り組んでみます!
この記事を書いた人
山口亨(中小企業診断士) UTAGE総研株式会社 代表取締役
公的支援機関を中心に、長年にわたり中小企業支援に携わる経営コンサルタント。
代表著作に「ガンダムに学ぶ経営学」「ドラクエができれば経営がわかる」がある。