Twilioのアイデアをひと言でまとめると、これまで特殊なプロトコルや標準規格、専門の“ソリューション”を使って行ってきた音声サービスの開発が、RESTやXML、PHP、Ruby on Railsといった標準的なWeb関連技術で可能になるプラットフォーム、となる。Google Voiceのようなクラウドによる電話処理を実装するためのサービスという言い方もできるかもしれない。
Twilioプラットフォームは、従来の電話網と、ネット上のサーバの間に位置する。Twilioは開発者に対して電話番号を発行する。ここに着信する電話に対する処理は、サーバ上の置いたプログラムやXMLファイルに従って行うことができる。応答として扱う音声ファイルはMP3としてサーバ上に置いておけばいいし、テキストファイルを音声化して電話側に流すといったことも、簡単なXMLファイルだけで行える。
例えば複数人をつなげる“カンファレンスコール”は、次の動画にあるように、XMLを1つサーバに用意するだけで実現できるという。URLさえあれば、置き場所とするサーバは、Google App EngineやDropboxでも構わないという。
VoIP関連製品はこれまで、例えばSIP、H.323、IAX、MGCP、G.722などWeb開発者に馴染みのないプロトコルやコーデックを使っていたが、Twilioでは、これをHTTP、XML、REST、MP3などに置き換える。利用する言語はPHP、Python(Google App Engineでもよい)、Ruby on Rails、Java、C#など、サーバアプリケーション開発で使われている言語であれば、何でも使える。「Say」と書けばテキストを読み上げてくれて、「Gather」と書けば電話のプッシュ音を拾ってくれる。「Play」と書けばMP3音声を再生する。「Record」で音声録音、「Call」で電話をかける。
IETFが策定したSIPは、HTTPに似せて作られていて、同時期に登場したITU-TのH.323に比べればインターネット的なプロトコルだと思う。しかし、それにしてもSIP関連のソフトウェアやサービスを作ったことのある開発者はどのぐらいいるだろうか? Twilioが成功しつつあるのを見ていると、私にはもうSIPに勝ち目があるようには思えない。Twilioは、すでにベンチャーキャピタルからシリーズAで370万ドル、シリーズBで1200万ドルの資金を調達している。
Google Voiceはやっぱりすごかった - @IT (via atm09td)
