起業・スタートアップのための
シリコンバレーの企業紹介 Siri

2021/01/07

アタッカーズ・ビジネススクールのスタートアップを目指すシニア・女性等への起業のアイデアとなるシリコンバレーの注目企業紹介のコラム。SRIインターナショナルからスピンアウトした企業紹介の第7回目の今回は、Siriについて、将来の起業家・アントレプレナーであるみなさんと共に見ていきましょう。

未来の起業家・アントレプレナー注目!Siriは人間の行動様式を変えた!

Siriは、起業・スタートアップを目指すみなさんなら、もうお使いの方も多いのではないでしょうか?そうはいっても、海外の友人と日本の友人を比べると、まだまだ使いこなしてはいないというのが、正直なところです。以下に、主な用途を紹介していきます。

例えば、「お母さんに電話をかけて」とiPhoneに語りかけると、自然に電話してくれる機能があります(この機能は実はモトローラでも90年代初頭には確立されており、目のあたりにした際には驚かされました)。「10分遅れますとMさんへメッセージ送って」と、レストランで待ち合わせの友人にメッセージを送ることもできます。どちらも交通違反を犯さずに目的を達成できるので、特に運転をしている際には非常に便利な機能ですよね?ちなみにお母さんやM さんなどの呼びかける名前は、電話帳に登録されている名称と一致していなくてはなりません。最近ようやく、Hey Siri(ヘイシリ)として、iPhoneに呼びかけることが推奨されてきたようです。

また、「国立近代美術館」と話しかけると、その営業時間、住所、電話番号、経路などを表示してくれます。単純な調べ物ではもうグーグルの検索も必要ないのでは?と思ってしまいます。

筆者は旅行好きで特に海外もよく訪れるのですが、海外を旅行していて電車に乗り遅れそう時に、ホームの番号が分かっても英語表記がないのでどこか分からずに困ったという経験がありました。例えば中国旅行中に3番ホームがどこかわからない際は、「3番ホームはどこですか?中国語で」とSiriに叫ぶと、「中国語では〇〇といいます」という日本語での紹介の後に、中国語に翻訳して喋ってくれます。こうした簡単な質問ならば、翻訳により相手に通じるので、少なくとも手振り、身振りでは教えてもらえるでしょう。

さらに、海外旅行での要注意項目に、両替で騙されるということがあります。特に1円が約140インドネシアルピアとなるような、桁が多い後進国を旅行している際には、注意が必要1桁間違えてしまうことも、よく起こります。一桁間違えてしまい、安いと思って買ったら高かったなどのミスも犯してしまいます。

筆者は昨年マレーシアを訪れた際に、アディダスのオシャレなテニスシューズを「3千円だ、安い」と思い購入したところ、ほぼ3万円で日本よりも高かったという苦い思い出があります。その際にSiriを使い、「4,000,000インドネシアルピア、いくら」と話しかけていたら、「28,560円です」と答えてくれて、間違えることもなかったわけです。

アラームのセット、本日の予定の確認、クリーニングの受取りなどのリマインダーなど、スケジューリング機能も、いちいち指を使う必要はもうないのです。指を使いすぎていて腱鞘炎気味の現代人には非常にありがたい機能だと、個人的には感じています。

Siriは、まさに、人々の行動様式を変化させてしまったと申し上げても、過言ではないでしょう。

音楽好きの方でしたら、サウンド・ハウンドなどの楽曲認識アプリをインストールしており、お店で流れていた曲の名前が知りたい時にはすぐに知ることができているでしょう。Siriはこうした機能も有しており、さらにアマゾンのレコメンド機能のように、自然にユーザーの曲の好みを理解していくのです。「僕の好きそうな曲を再生してよ」ということまで可能になっています。そう、SiriはAI機能も備えているのです。

起業・スタートアップを目指す方必見!SiriはSRIインターナショナルが開発した音声認識システムとAIがベース

Siriが脚光を浴びたのは21世紀になってからですが、上記のモトローラの例にあるように、その元となった技術は1990年代にまで遡れます。

SRIインターナショナルは、米国政府のために、ダイナスピーク(DynaSpeak®)とエデュスピーク(EduSpeak®)という2つの自然言語会話認識技術を開発していました。この技術をベースに、SRIインターナショナルは1994年にニュアンス・コミュニケーションズ(Nuance Communications)をスピンオフさせます。ニュアンスは1996年には、最初の大規模な音声認識アプリケーションを開発しました。そして同年、その音声認識アプリケーションが、電話での株式取引において米国大手証券会社のチャールズ・シュワブに採用されました。

そして、コールセンター業務の自動化により、ニュアンス・コミュニケーションズは発展していくこととなります。現在では日本でもコールセンターに電話すると、自動音声が応答してきて、ある目的なら1、これなら2、それなら3、その他なら4というように指示をしてくるのは当たり前になっています。しかし、米国では1990年代から、日本でも大手米国企業、例えばアメックスやユナイテッド航空に電話をすると、こうした自動音声応答が実施されていたのを将来のアントレプレナーを目指すシニアの方ならば思い出されたのではないでしょうか?こうしてニュアンスは、2000年には上場を果たします。

Siriは、ニュアンスの持つ音声認識システムと、AIを統合したものです。ユーザーの言葉だけでなく、その意図も理解しようとしているのです。ニュアンス、SRIインターナショナル、そしてアップルの協力により生まれたのです。

Siriの技術の根幹は、ニュアンスが開発してきた音声認識システムと自然言語処理技術です。認識システムがニュアンス時代のサーバーではなく、iPhoneというスマートフォンに置き換わることにより、一気に一般にまで普及させた点がやはり一番の功績でしょう。

その認識プロセスは、以下のようなものです。

  1. ユーザーの会話入力を把握する
  2. オーディオ技術で背景の騒音を消す(ノイズ・キャンセリング)
  3. 入力された音を小さく分ける(10〜100ミリ秒単位)
  4. それぞれの分断された音を判断する
  5. 話された文節を記録されている音のコンビネーションから判断する

この他に、単語や文節のSiri内蔵の語彙への追加、話された言葉の既存の語彙との比較などのソフトウェアも、音声認識に貢献しています。

こうした長年に渡る開発を経て、現在では上記の「お母さんに電話をかけて」という呼びかけも、理解してくれるようになったわけです。

将来の起業家・アントレプレナー注目!会社としてのSiriの誕生とアップルによる買収

そしてこのニュアンスから提供された音声認識システムの提供を受け、SRIインターナショナルのAIセンターのマシーン・ラーニングプロジェクトがスピンオフして、会社としてのSiriが誕生しました。2007年12月のことです。

対応言語としては2005年のプロジェクト・スタート時には、イギリス英語、アメリア英語、オーストラリア英語の英語のみでした。現在は、英語をはじめとした主要な欧州言語、アラビア語、中国語、日本語、韓国語などアジア言語も含め約20言語に対応しています。

2010年にはiOSのアプリとしてアップルに採用され、2ヶ月後には同社に買収されることとなりました。2011年11月に発売されたiPhone4SからiPhoneに標準装備されることとなりました。そして、ブラックベリーなど他のスマートフォンに対応したアプリは他の買収された会社の製品と同様にアップルストアから削除され、Siriはアップル専用のソフトウェアとなったのです。iPadやMacなど他のアップル製品でも使用可能となりました。

このSiriの技術はAI(スマート)スピーカーに引き継がれ、特に欧米では、一般にもさらに身近なものになっています。Siriがなければスマート・スピーカーは現在存在していないわけで、やはり画期的な商品だったことが、将来の起業家である女性・シニアなどの閲覧者の方々にもご理解いただけたのではないでしょうか?

次回はサムリーについて解説していきます。

著者:ポッシュF
東京大学卒業後、世界のトップ20に入るアイビー・リーグのMBA修了。外資系IT企業のアナリスト、エグゼクティブ、Web社長等を歴任。3度起業し、2度のエグジットに成功している。
FX業界の重鎮である今井雅人氏の5冊の著書を再構成・無料公開した「FX初心者の資産形成・運用向け今井流FX入門・始め方と口座比較」の講義解説者でもあり、今井氏と並ぶトップFXアナリストの西原宏一氏につけられたあだ名がポッシュ。FはFXのF。