会議の文字起こしAIツールは増えていますが、「録音ファイルはどこに送られるのか」「クラウドに音声が残り続けないか」という不安が、とくに日本のビジネスユーザーの導入障壁になっています。機密情報が飛び交う会議では、音声データの扱いが信頼の核心。AIの便益とプライバシーの安心感は、設計レベルから両立させなければなりません。
既存ツールは音声をサーバーに蓄積・活用するケースが多く、ユーザーは「どこに残るか分からない」不安を抱えながら使っていた。
会議での話し言葉・専門用語・複数話者が混在する状況で高品質な文字起こしを実現するには、エンジンの選定と統合の工夫が必要だった。
録音後一括処理(低レイテンシ要件)とライブ文字起こし(WebSocket維持コスト)を、限られたインフラリソースで両立させる必要があった。
メールアドレス認証・Googleログイン・未ログイン誘導・セッション管理を、技術的に正確かつUX的に自然な形でつなぐ必要があった。
Cloudflareトンネルを介したWebSocketパスのルーティング設定ミスにより、ライブ録音機能が本番で無音のまま停止するというP0障害が発生した。
coconuts.tokyoはHTTP 200・3ドメイン対応で本番稼働中。Firebase Auth・Groq Whisper API・Deepgram Nova-3 WSはすべて本番接続済みで、P0障害(WebSocketパスバイパス)も実機で修正・検証済み。特商法ページを完備し、Pro課金は待機リストで受け付ける段階ローンチというビジネス判断のもと、無料ティアで本番公開しています。
※ 達成度イメージ(導入前 12% → 導入後 88%+)は、自社評価による代表値です。音声保持0秒・SEOルート数・バックアップ保持日数は本番環境の実測値です。