맥락 인식 AI가 앱마다 음성을 다르게 다듬어 주는 방법

문장 하나를 소리 내어 말해 봅시다. "시간 날 때 최신 수치 좀 보내줄 수 있어?" 이 말이 어디로 가느냐에 따라 어떤 모습이 되어야 하는지가 정해집니다. Slack에 넣으면 그대로도 충분합니다. 고객 이메일에 넣는다면 인사말과 좀 더 부드러운 요청이 필요합니다. Jira 코멘트로 남긴다면 세 단어로 줄여야 합니다. "최신 수치 필요."

여러분은 이런 조정을 의식하지 않고 해냅니다. 머릿속에서 상황을, 즉 어떤 앱인지, 누구에게 보내는지, 얼마나 격식을 차려야 하는지를 읽고 말이 나오는 순간에 단어를 다시 빚어냅니다. 맥락 인식 AI는 여러분이 받아쓴 음성에 대해 바로 그 일을 자동으로 해 줍니다.

지금 이걸 신경 쓸 만한 이유는 받아쓰기 기술이 마침내 쓸 만해졌기 때문입니다. 말은 분당 약 150단어 속도로 할 수 있는데, 이는 대부분이 타이핑하는 분당 40단어보다 서너 배 빠릅니다. 하지만 다듬어지지 않은 날것의 음성은 어떤 앱이 원하는 글쓰기 방식과도 맞지 않습니다. 그 간극을 메우는 것이 바로 다시 쓰기 계층입니다.

한 문장, 여섯 가지 다른 메시지

음성은 격식에 중립적입니다. 말을 할 때 우리는 형식을 고르지 않습니다. 그냥 할 말을 하고, 형식은 나중에, 어디로 보낼지 정할 때 여러분이 덧붙입니다.

글쓰기는 반대로 작동합니다. 타이핑하는 모든 앱에는 텍스트가 어떻게 보이고 들려야 하는지에 대한 나름의 조용한 규칙이 있습니다.

수치를 요청하는 그 똑같은 말을 가져다가 창에 따라 어떻게 모양이 바뀌는지 살펴봅시다. - Slack: "시간 날 때 최신 수치 좀 보내줄 수 있어?" - 이메일: "안녕하세요 마리아 님, 시간 되실 때 최신 수치를 보내주실 수 있을까요? 감사합니다!" - Jira: "최신 수치 필요." - 본인에게 남기는 메모: "대기 중: 마리아에게 받을 최신 수치." - 동료에게 보내는 문자: "최신 수치 좀 보내줄래?"

매번 의도는 같습니다. 다섯 가지 표면, 다섯 가지 다른 정답. 여러분은 이미 이 모두를 그때그때 만들어 냅니다. 문제는 각각이 거의 알아채지도 못하는 작은 재조정 비용을 요구하고, 그 일이 끊임없이 일어난다는 점입니다. 하버드 비즈니스 리뷰의 한 연구는 직장인들이 하루에 약 1,200번 앱 사이를 오간다고 측정했는데, 이는 대략 24초마다 한 번꼴입니다. 그 전환의 상당수에는 새로운 글쓰기 스타일이 따라붙습니다.

받아쓰기 대 맥락 인식 다시 쓰기

보통 하나로 묶여 다뤄지는 두 가지 일을 떼어 놓고 보면 이해가 쉽습니다. 받아쓰기는 소리를 단어로 바꿉니다. 맥락 인식 다시 쓰기는 그 단어를 갈 곳에 맞는 메시지로 바꿉니다.

단순 받아쓰기는 1단계에서 멈춥니다. Apple Dictation, 대부분의 음성-텍스트 변환 도구, 휴대폰의 실시간 자막은 군더더기와 말 더듬까지 포함해 여러분이 말한 그대로의 기록을 건네줍니다.

빠르게 떠오른 생각을 날것 그대로 받아쓰면 실제로는 이런 모습입니다. ``` 어 그러니까 음 내 생각엔 우리가 아마 그 출시를 다음 주로 미뤄야 할 것 같아 왜냐면 그 그 QA가 아직 안 끝났거든 알지 ```

맥락 인식 다시 쓰기는 그 똑같은 음성을 가져다 두 번째 질문을 던집니다. 이건 어디로 가는가, 그리고 거기서는 어떻게 들려야 하는가? 팀에게 보내는 Slack 메시지로 향한다면 이렇게 돌아옵니다. ``` 출시 다음 주로 미루죠. QA가 아직 안 끝났습니다. ```

들어가는 단어는 같고, 나오는 단어는 목적지에 맞게 다릅니다. 첫 번째는 녹음입니다. 두 번째는 실제로 보낼 수 있는 무언가입니다. 이 다듬기 측면에 대해 더 알고 싶다면 AI 음성 받아쓰기의 작동 원리를 정리한 글을 참고하세요.

왼쪽의 지저분한 음성 받아쓰기 하나가 오른쪽의 깔끔한 세 메시지로 갈라지는 모습: 가벼운 Slack 메모, 격식 있는 이메일, 짧은 티켓 코멘트

AI에게 "맥락"이란 실제로 무엇인가

"맥락 인식"이라는 말은 이 도구들이 읽어 들이는 구체적인 단서를 들여다보기 전까지는 막연하게 들립니다. 신비로운 건 전혀 없습니다. 맥락이란 AI가 단어 하나를 건드리기 전에 확인하는 신호의 짧은 목록입니다.

활성화된 앱

가장 큰 신호는 말할 때 어떤 앱이 활성화되어 있느냐입니다. 도구는 Slack이 앞에 있는지, Gmail인지, VS Code인지 알 수 있습니다. 그 한 가지 사실만으로도 스타일이 크게 좁혀집니다. 채팅은 짧고 편하게, 메일은 짜임새 있고 정중하게, 코드 에디터는 간결하고 직설적으로 원합니다.

커서 주변의 텍스트

어떤 도구는 입력하려는 지점 근처의 텍스트를 조금 읽습니다. 위쪽 메시지가 "카츠 박사님께,"로 시작한다면 AI는 격식을 유지하고 이름의 철자를 정확히 씁니다. 한 줄짜리 농담이 잔뜩 쌓인 스레드라면 거기에 맞춥니다.

브라우저가 아니라 웹사이트

브라우저 안에서는 앱 감지가 모호해집니다. Gmail, X, Google Docs가 모두 같은 창 뒤에 숨어 있기 때문입니다. 더 나은 도구는 URL을 보고 이들을 구분해서, Gmail 탭은 이메일 처리를 받고 X 탭은 짧고 강렬한 게시물 처리를 받습니다.

앱 카테고리

지금까지 나온 모든 앱에 일일이 규칙을 두는 대신, 대부분의 시스템은 앱을 몇 개의 묶음으로 분류합니다. 이메일, 업무 채팅, 개인 메신저, 문서, 코드, 그리고 나머지 전부를 위한 포괄 카테고리입니다. 각 묶음에는 스타일이 있습니다. 알려진 묶음에 들어가는 새 앱은 첫날부터 그 스타일을 물려받습니다.

이 신호들을 쌓으면 AI는 상황을 그럭저럭 읽어 냅니다. 이름이 적힌 사람에게 보내는 격식 있는 이메일인지, 가벼운 스레드에 던지는 한마디인지 말이죠. 그 읽기가 바로 AI가 기준으로 삼아 다시 쓰는 대상입니다.

여러분의 음성이 어떻게 알맞은 메시지가 되는가

조각들을 늘어놓으면 전체 과정은 네 단계로 빠르게 끝납니다. 모두 여러분이 문장을 마치고 텍스트가 나타나기까지의 1~2초 사이에 일어납니다. 1. 캡처. 키를 누른 채 말합니다. 도구는 손을 뗄 때까지 녹음합니다. 2. 받아쓰기. 음성 모델이 오디오를 날것의 텍스트로, 즉 여러분이 말한 그대로 바꿉니다. 3. 맥락 감지. 도구는 활성화된 앱, 커서 근처의 텍스트, 그리고 그 앱이 어느 묶음에 속하는지를 확인합니다. 4. 다시 쓰기. 언어 모델이 날것의 받아쓰기와 그 맥락을 받아, 갈 곳에 맞는 길이와 어조로 최종 메시지를 작성합니다.

4단계가 대규모 언어 모델이 무거운 일을 도맡는 지점입니다. 모델은 지저분한 받아쓰기와 함께 "이건 업무 이메일로 들어가니 그렇게 읽히게 만들어라"로 요약되는 지시를 받고, 알맞은 길이와 어조, 모양의 텍스트를 돌려줍니다. 결과는 모델에 따라 달라지므로, 출력은 정답이 아니라 탄탄한 초안으로 다루는 것이 좋습니다.

이것이 바로 Voicr가 macOS에서 실행하는 정확한 흐름입니다. FN 키를 누른 채 어떤 앱에서든 말하면 됩니다. Voicr는 어떤 앱이 앞에 있는지 알아채고, Smart Rules를 통해 맞는 스타일을 적용한 뒤, 다듬어진 텍스트를 클립보드에 떨어뜨립니다. Slack에서는 편하게, Gmail에서는 정중하게, 에디터에서는 간결하게요. 어조를 고르려고 메뉴를 열 필요가 전혀 없습니다. 이 앱별 스타일이 어떻게 작성되는지 보고 싶다면, 좋은 규칙에 무엇이 담기는지 짚어 주는 스마트 글쓰기 규칙 가이드를 참고하세요.

친근한 아이콘으로 표현한 네 단계 파이프라인: 음성을 캡처하는 마이크, 받아쓰기, 활성화된 앱을 감지하는 돋보기, 그리고 클립보드로 떨어지는 다듬어진 메시지

두 가지 방식: 자동 감지와 명시적 규칙

모든 맥락 인식이 같은 방식으로 작동하지는 않습니다. 도구는 두 진영으로 나뉘는데, 차이는 대부분 누가 스타일을 결정하느냐에 있습니다.

자동 방식은 여러분 대신 판단을 내립니다. 앱을 읽고, 카테고리로 분류한 뒤, 설정 없이 내장된 스타일을 적용합니다. 설치하면 그냥 작동합니다. 단점은 통제권입니다. 도구가 생각하는 "이메일 어조"가 여러분 것과 맞지 않으면, 출력을 일일이 손으로 손봐야 하는 처지가 됩니다.

명시적 방식은 운전대를 여러분에게 넘깁니다. 앱마다 어떻게 들려야 하는지를 평범한 말로 짧게 지시문을 씁니다. 처음에 손이 더 가지만, 취향을 직접 정의했으니 출력이 취향에 맞습니다. Slack 규칙은 이렇게 쓸 수 있습니다. ``` 가벼운 Slack 메시지로 다시 써라. 두세 문장, 줄임말 괜찮음, 인사말이나 맺음말 없이. 어울릴 때만 가벼운 이모지. ```

더 나은 도구는 둘을 섞습니다. 설치 즉시 작동하는 합리적인 기본값에, 신경 쓰고 싶을 때 직접 쓸 수 있는 앱별 규칙을 더하는 식이죠. 거의 쓰지 않는 앱에는 기본값에 기대고, 글쓰기가 정말 중요한 두세 곳에는 명시적 규칙을 설정합니다.

잘하는 것, 그리고 여전히 헛디디는 것

맥락 인식 다시 쓰기는 진짜로 쓸모가 있지만, 마음을 읽는 게 아니라 출발점일 뿐입니다. 어디서 비틀거리는지 알아 두면 맹목적으로 믿지 않게 됩니다.

형식은 완벽하게 잡습니다. 의도는 추측합니다.

AI는 여러분이 이메일 안에 있다는 걸 알아채고 인사말을 붙일 수 있습니다. 하지만 여러분이 진심인지 무미건조한 건지, 또는 "괜찮아"가 정말 괜찮다는 건지 속으로 부글거리는 건지는 확실히 가려내지 못합니다. 같은 격식 안에서의 어조는 여전히 여러분 몫입니다.

애매한 앱은 헷갈리게 만듭니다

포괄 카테고리에 든 브라우저, 채팅 클라이언트를 돌리는 터미널, 온갖 용도로 쓰는 메모 앱은 약한 신호를 줍니다. 맥락이 흐릿할 때 다시 쓰기는 일반적인 다듬기로 물러나는데, 그게 여러분이 원한 것보다 더 격식 있거나 덜 격식 있을 수 있습니다.

여러분의 목소리를 깎아낼 수 있습니다

다시 쓰기를 너무 세게 밀어붙이면 여러분의 메시지가 남들과 똑같이, 매끈하고 유능하지만 약간 생기 없게 들리기 시작합니다. 좋은 도구는 여러분의 목소리를 기업식 기본값으로 바꿔치기하는 대신 알맞은 격식으로 옮겨 줍니다. 출력이 여러분답게 들리지 않게 된다면 규칙의 강도를 낮추세요.

보내기 전에 여전히 읽어야 합니다

이름이 틀리게 나올 수 있습니다. 숫자가 미끄러질 수 있습니다. 자동 수정된 문자를 보내기 전에 슬쩍 훑어보듯이, 보내기 전에 결과를 한번 훑어보세요.

맥락 인식 다시 쓰기를 실제로 활용하기

오늘 당장 써 보고 싶나요? 글을 가장 많이 쓰는 두 앱, 보통 채팅 도구와 이메일에서 시작하세요. 다음 몇 개의 메시지를 타이핑 대신 거기서 받아쓰기로 만들어 보고, 그러고 나서 실제로 손볼 게 얼마나 적은지 지켜보세요.

그다음에는 빗나간 부분에 주목하세요. 출력이 틀렸을 때, 그건 유용한 정보입니다. 그 앱의 스타일을 손봐야 한다거나, 의도를 소리 내어 더 분명히 말해야 한다는 뜻이니까요. 이 도구들은 각 앱이 어떻게 들려야 하는지를 분명히 알려줄수록 더 날카로워집니다. 같은 요령은 뻔한 두 앱뿐 아니라 글을 쓰는 모든 앱에서 통하는데, 이는 키 하나로 어떤 Mac 앱에서든 받아쓰기에서 다룬 바 있습니다.

진짜 이득은 속도만이 아닙니다. 물론 타이핑보다 세 배 빠르게 말하는 건 좋은 출발이긴 합니다. 실제로 달라지는 건 형식을 머릿속에 짊어지고 다니지 않게 된다는 점입니다. 생각을 떠올리고, 한 번 말하고, 어떤 버전이 어디에 속하는지는 도구가 정리하게 둡니다.

한 번 말하면 어디에나 도착합니다

오래된 습관은 메시지와 형식을 같은 순간에 함께 쓰는 것입니다. 단어, 어조, 인사말, 맺음말을 한 번에, 모든 앱에 대해, 하루 종일 말이죠. 맥락 인식 AI는 그 수고를 둘로 나눕니다. 여러분은 생각을 가져옵니다. AI는 형식을 가져옵니다.

그 차이를 가장 빠르게 느끼는 방법은 다음 이메일을 타이핑 대신 받아쓰기로 써 보는 것입니다. 갈 곳에 맞게 이미 다듬어진 음성을 원한다면, Voicr가 여러분의 Mac에서 그 일을 해 줍니다. FN을 누르고 말하면, 텍스트가 지금 있는 앱에 맞는 어조로 도착합니다. 입에서 나온 한 문장이, 모든 창에서 알맞은 메시지로요.