AI 받아쓰기 앱은 이제 “말을 텍스트로 바꿔주는 도구”라는 설명만으로는 부족합니다. TechCrunch가 2026년 기준으로 테스트한 앱들을 보면, 음성 입력은 이메일 답장, 회의 메모, 긴 노트 정리, 심지어 코딩 환경까지 파고들고 있습니다. 키보드 옆의 보조 기능이 아니라, 작업을 시작하는 첫 입력 레이어가 되고 있는 셈입니다.
가장 흥미로운 축은 로컬 우선 흐름입니다. Willow는 transcript를 기기에 로컬 저장하고 모델 학습에서 빠질 수 있게 합니다. Monologue는 AI 모델을 직접 기기에 내려받아 클라우드 없이 전사할 수 있다고 설명합니다. Superwhisper는 자체 모델뿐 아니라 Nvidia Parakeet speech-recognition 모델을 고르게 하고, 로컬 모델과 클라우드 모델, 개인 API 키 연결까지 열어둡니다. VoiceTypr는 오프라인 우선, 99개 이상 언어 지원, 오픈소스 버전까지 전면에 둡니다.
이 흐름이 중요한 이유는 받아쓰기가 다루는 데이터의 성격 때문입니다. 사용자가 마이크에 말하는 내용에는 다듬어지지 않은 초안, 개인 말버릇, 회사 내부 용어, 이메일 맥락, 코드 변수명 같은 정보가 섞입니다. 일반 텍스트 입력보다 오히려 더 사적인 데이터가 흐를 수 있습니다. 그래서 “정확도”와 “속도”만큼이나 “어디서 처리되는가”가 제품 선택의 핵심 기준이 됩니다.
물론 로컬이 모든 답은 아닙니다. Wispr Flow는 macOS, Windows, iOS 앱을 제공하고, formal·casual·very casual 같은 스타일 선택과 custom words를 지원합니다. Cursor 같은 vibe-coding 도구와 함께 쓸 때 변수명이나 파일 태그를 인식하는 기능도 있습니다. Aqua는 낮은 latency와 문구 자동 완성, speech-to-text API를 앞세웁니다. AudioPen은 받아쓰기를 넘어 음성 노트 저장, 요약, 기존 노트 재작성으로 확장합니다. 즉 각 앱은 privacy, speed, workflow integration, note intelligence 중 어디에 무게를 둘지 다르게 선택하고 있습니다.
가격 구조도 이 시장의 방향을 보여줍니다. Wispr Flow와 Willow는 월 15달러부터 시작하는 무제한 구독형에 가깝고, Monologue는 월 10달러 또는 연 100달러입니다. Aqua는 연간 결제 기준 월 8달러부터 시작합니다. 반면 VoiceTypr는 한 기기 35달러 평생 라이선스, VoiceInk는 25달러부터, Dictato는 약 12달러 수준의 구매형 모델을 제시합니다. 매일 음성으로 일하는 사람과 가끔 로컬 전사가 필요한 사람의 선택은 달라질 수밖에 없습니다.
이번 라운드업의 결론은 특정 앱 하나를 고르라는 것이 아닙니다. AI 받아쓰기 앱을 고를 때 질문을 바꿔야 한다는 점입니다. 내 음성 데이터는 기기에 남는가, 클라우드로 가는가. 회사 용어와 내 말버릇을 반영할 수 있는가. 메일, 메모, IDE, 브라우저에서 각각 다른 톤과 포맷을 적용할 수 있는가. 무료 단어 수와 유료 가격이 실제 사용량에 맞는가. 2026년의 받아쓰기는 타이핑을 조금 줄이는 기능이 아니라, 개인 AI 작업대의 입구로 이동하고 있습니다.