디지털 음성 비서의 종말
업데이트 날짜:2023년 12월 12일
저는 악랄한 사람이 아닙니다. 나는 자부심이 없습니다. 하지만 가끔은 "내가 그랬지"라고 말하는 좋은 순간을 즐긴다. 결국, 기술 회사에서 기술자로 생활하는 동안 중요한 회의 사이에 Linkedin 다이제스트에서 새롭고 멋진 내용에 대해 방금 읽은 "영감받은" 관리자가 DevOps 및 AI/ML과 같은 단어를 분쇄기에 던져 넣은 미래에 대한 강의를 듣게 될 때, 상황이 필연적으로 예상대로 진행될 때 자신이 정당하다고 느끼는 것은 자연스러운 일입니다. 디지털 비서의 비현실적인 현실이 좋은 예입니다.
지난 1년여 동안 디지털 비서의 수익성이 떨어지고 결과적으로 관련 팀과 기술이 도태되었다는 보고와 이야기가 나왔습니다. 옛날에는 Siri, Cortana, Alexa가 대세였지만 지금은 그렇지 않습니다. 나에게 있어서 이 결과는 처음부터 명백했다. 나는 다시 한 번 필연적으로 옳았다는 것이 입증되기까지 몇 년을 기다려야 했습니다. 그 이유를 알려드리겠습니다.
목적이 없는 기술
왜, 왜, 왜, 왜, 왜. 누군가가 새로운 기술을 제시하거나 삶을 '혁명'시킬 새로운 변화를 제안할 때마다 구역질이 날 정도로 우리는 이 질문을 던져야 합니다. 첫째, 혁명은 모두 대규모 유혈 사태와 비극에 관한 것이므로 그렇지 않습니다. 둘째, 생명은 있는 그대로 최적화되므로 급진적인 파괴자가 필요하지 않습니다(카다시안 제외). 셋째, 변화나 기술을 제안하는 사람이 말을 더듬지 않고 '왜'라는 질문에 모두 답할 수 있다면, 그 사람은 뭔가를 하고 있는 것일 수도 있습니다.
디지털이나 AI 비서 이야기가 나올 때마다 내가 얻은 것은 이것이 아니다. 내가 들은 것은 거의 컬트 수준의 "당신의 삶을 개선할 수 있다", "작업을 단순화한다", "당신을 위해 우유를 주문하라" 및 이와 유사한 IoT 유행어뿐이었지만 실제 문제는 없었습니다. 실제로 제가 본 유일한 시나리오는 다음과 같습니다.
바쁘고 부유한 마케팅 담당자 겸 기술 전문가(물론 미국에서)가 Bluetooth 동글을 귀에 물고 그들의 바쁜 부유한 삶에 대해 이야기하는 진부하고 약간 포화된 3분짜리 비디오입니다. 그들은 젊고 독신이며, 바쁘고 부유한 삶이 요리에 의존한다면 요리를 할 수 없습니다. 일상생활을 하기에는 회의가 너무 많습니다. 그래서 그들은 우유 사는 것을 잊어버렸어요! 윽! 이제 집으로 운전하면서 디지털 비서에게 전화를 걸면 비서가 모든 일을 처리합니다. 원격으로 에어컨을 켜고 우유를 주문하면 그들이 2시간 30분 동안의 교통체증을 뚫고(대중교통은 가난한 사람들을 위한 것이기 때문에) 고가의 스튜디오까지 도착할 때쯤에는 우유가 거기에서 그들을 기다리며 편안하게 지냅니다.
그리고 ... 그게 다야. 이것이 제가 보여드린 거의 유일한 것입니다. 아니면 알람 시계, 음악 생활, 1960년대 진부한 SF 영화처럼 멋지고 화려한 특수 효과 외에는 아무 차이도 없는 사소한 말도 안 되는 것들과 같은 약간의 변형일 수도 있습니다.
출처:Unsplash의 Jacek Dylag 사진.
장애인이나 노인 돕기, 외로운 사람들 돕기, 고강도 환경 및/또는 생산 라인의 작업자 돕기 등 의미 있는 일을 위해 디지털 비서가 제안되는 것을 본 적이 없습니다. 하지만 그건 블루투스 이어를 가진 사람만큼 매력적이지는 않은 것 같아요.
완전히 냉소적인 것은 제쳐두고, 일상적인 일을 처리할 수 있는 실제 비서, 즉 인간을 가질 만큼 부자가 아니라는 사실을 본질적으로 잔인하게 상기시키는 것이기도 합니다. 실제로 진정한 권력을 가진 사람들이 갖고 있는 것이 바로 이것이다. 일상적인 일을 돕는 인간 조수. 진지한 VP, SVP, CXO 등을 살펴보면 한두 명 정도가 따라옵니다. 그리고 집에는 요리사, 가정부, 수영장 청소부가 있을 수도 있습니다.
표준에 맞게 전문가가 디자인함
이제 두 번째이자 더 큰 문제는 디지털 보조 장치가 사용자의 언어를 사용하지 않는다는 것입니다. 평범하고 단순합니다. 아마도 그렇습니다. "자연어" 단어와 문구를 사용하여 디지털 상자에 이것저것 하라고 지시할 수 있지만 이는 기본적인 작업에만 작동합니다. 우유처럼요.
어시스턴트가 실제로 자신을 위해 일하게 하려면 프로그래머의 마음이 필요하며 일련의 의사 코드 if-then 조건을 지시해야 합니다. 그렇지 않으면 작업이 실패합니다. 예를 들어, 저는 노트북을 사고 싶었습니다. 하지만 책을 읽고, 검색하고, 기기를 비교하고, 사람의 리뷰를 읽고, 매우 구체적인 세부 사항을 확인하면서 몇 시간을 보내기 전까지는 마음 속에 명확한 것이 없었습니다.
이제 그것을 기계로 어떻게 번역합니까? 내 취향에 맞는 노트북을 찾으시나요? 아니요. 다음과 같이 말해야 합니다. 저는 400니트 화면, 바람직하게는 16:10 비율과 2-4K 해상도를 갖춘 14인치 노트북을 원합니다. 프로세서는 AMD 또는 Intel이 될 수 있으며 대부분 중간급, 탈착식 배터리 등이 될 수 있습니다. 이것은 특히 머리 꼭대기에서 덜거덕거리며 떨어져 나가야 하는 경우에는 지치게 합니다. 또는 모든 요구 사항을 적어 둘 수도 있는데, 이는 처음부터 보조자가 필요하지 않음을 의미합니다. 시간을 절약할 수 없습니다. 그리고 어쨌든 확인하고 확인해야 할 작업을 기계가 수행하도록 추가 숙제 없이 직접 수행하는 것이 좋습니다. 규칙 해킹 1번:지름길은 없습니다. 시간을 절약할 수는 없습니다. 그거 똥이야.
귀하의 요구를 듣고 귀하의 "AI" 조수. 출처:Unsplash의 Rock'n Roll Monkey 사진.
신뢰할 수 없는 시장
다음으로, 당신이 매우 복잡한 쿼리를 작성할 수 있고 기계가 당신의 요청을 안정적으로 이해하고 해석할 수 있다고 가정하면(외국어는 물론이고 다양한 지역 영어 악센트에서도 종종 그럴 수 없는 경우가 있음) 다음에는 무엇을 해야 할까요? 필요한 하드웨어를 구입하기 위해 기계는 어디로 이동하나요?
가장 큰 문제는 실제로 100% 신뢰할 수 있는 시장이 없다는 것입니다. 어디를 가든 온라인이든 실생활이든 모든 것을 확인하고 또 확인해야 합니다. 악의가 없더라도 사람들은 실수를 할 수 있고, 제품에 라벨을 잘못 붙일 수도 있고, 약간의 세부 사항을 놓칠 수도 있고, 마음이 바뀔 수도 있습니다. 우리의 일상생활에는 수천 가지의 변형과 작은 자기 역설이 있으며, 이를 안정적으로 코딩하여 기계에 전달할 수 없으며 어떤 종류의 정상적인 결과도 기대할 수 없습니다. 인간은 본질적으로 예측할 수 없으며, 특히 개인 수준에서는 더욱 그렇습니다.
신뢰의 사슬도 없고 정확성의 사슬도 없습니다. 맹목적으로 누구든지, 즉 사람이든 기계든 누구든지 확인 없이 맹목적으로 대량 구매를 하도록 허용하시겠습니까? 껌을 씹는 것은 물론이죠. 하지만 가구, 전자 제품은요? 절대 안돼요.
경영진이 자신들의 기술이 놀라운 결과를 낳지 못했다는 사실에 놀랐을 때 저는 놀랐습니다. 사람들은 사소한 일이나 사소한 구매를 위해 이러한 비서를 사용하며 예측 가능하고 반복 가능한 패턴(판매자가 좋아하는 유형, 반복 구매)을 실제로 설정하지 않았습니다. 여기에 언어 문화 문제, 다양한 국가의 공급망 인프라 준비 상태의 엄청난 차이, 온라인 상점의 성숙도, 현지 배송 가능 여부, 운영 비용, 그리고 마지막으로 원시적인 인간 본성을 추가하면 작동하지 않는 모델이 나옵니다.
인간은 쇼핑을 좋아합니다
생물학적 이유가 무엇이든 인간은 실제로 물건을 얻는 데 시간을 투자하는 것을 좋아합니다. 음식, 옷, 전자제품, 자동차, 가구 등 사람들은 미세한 개인적인 결정을 통해 이러한 물건에 자신만의 손길을 더하는 것을 좋아합니다. 그것이 바로 우리가 기계와 다른 점이기 때문입니다. 거실을 꾸미고 싶다면 물론 IKEA 같은 곳에서 기성품을 구입할 수 있지만 집집마다 다르며 일반적이고 영혼 없는 물건에 개인 정보를 추가하는 데 엄청난 시간과 에너지가 소모될 것입니다.
음식을 살 때 물론 기본은 동일하지만 어느 날은 빵 A를 먹고 또 다른 빵은 B를 먹고 어쩌면 어느 날 파스타를 먹게 될지도 모릅니다. 이것이 인간 본성의 혼돈스러운 아름다움이며, 알고리즘화할 수 없습니다. 바쁜 사람들이라도 온라인 쇼핑을 할 때 필요한 것이 무엇인지 파악하는 데 여전히 시간을 투자합니다. 어쩌면 가게에 가서 실제 배달까지 시간을 절약할 수도 있겠지만, 중간 부분은 남아 있고, 사람이겠지. 하지만 이것이 바로 디지털 어시스턴트가 약속하는 일입니다.
출처:사진:Atharva Tulsi, Unsplash.
따라서 우리는 실제로 문제 없이 원래 솔루션으로 돌아갑니다. 너무 바빠서 인생을 즐길 수 없고 유토피아적인 예측 구매 네트워크를 통해 100% 성공과 보장을 유지할 수 있는 영혼 없는 기업에 디지털 비서가 광고되었습니다. 일어난 일은 평범한 사람과 괴짜 모두 상품을 시험해 보고 약간 다른 방식으로 자신의 필요를 충족하는 데 일반적으로 필요한 것과 동일한 시간을 투자해야 한다는 것을 깨달았습니다. 그들은 자신의 돈을 말하는 상자에 맡기기에는 돈을 너무 좋아한다고 생각했고 값비싼 물건의 구매는 보기보다 훨씬 더 복잡하고 예측할 수 없으며 온라인 상점은 실제로 맹목적으로 신뢰할 수 없으며 ... 모두 말도 안된다는 것을 깨달았습니다.
아마도 시나리오는 화난 사람들, 교통 체증, 기발한 의사 결정, 수많은 가짜 제품 등이 있는 현실 세계가 아닌 공상 과학 영화의 무균 환경에서 작동할 것입니다. 마지막으로, 매우 정확한 일일 일정, 구매 습관 및 기타 정보를 포함하여 자신에 대한 거의 모든 것을 음성 상자에 알리는 것이 개인 정보 보호에 미치는 엄청난 영향을 잊지 마십시오.
결론
나는 그 결과에 어느 정도 만족한다. 이러한 기술을 연구하는 사람들이 자신의 아이디어와 제품이 수포로 돌아가는 것을 보게 되어 기쁘지 않지만, 유행어에 만족하는 경영진을 비난하십시오. 구체적인 예를 생각하면서 저는 다양한 Android 휴대폰에서 Google 어시스턴트를 중성화하는 데 너무 많은 시간과 분노를 보냈기 때문에 그것이 소외되거나 사라지는 것을 보게 되어 기쁩니다. 나를 짜증나게 하고 비활성화하는 데 시간을 낭비하는 것 외에는 어떤 목적도 없습니다.
디지털 비서는 기본적으로 효율성이 떨어집니다. 실제로 필요한 작업을 물리적으로 수행할 수는 없으므로 기계용으로 설계된 언어로 큰 소리로 표현해야 하는 생각을 해석하는 역할에 불과합니다. 이미 회사에서 할당한 프로젝트 관리자가 있는 프로젝트의 외부 컨설턴트 프로젝트 관리자와 같습니다. 어쨌든 그것은 당신이 상자를 섬기는 사람이고 그 반대가 아닌 무의미한 의식입니다. 생각해 보면 매우 아이러니합니다. 하지만 결국 인류에게는 희망이 있다고 생각합니다. 규범조차도 이에 속하지 않았으므로 아마도 우리는 보이는 것만큼 멍청하지 않을 것입니다.
ㅋㅋㅋ, 농담이군요. 차세대 AI 비서가 있습니다. 안녕 Google 어시스턴트, Cortana, 안녕하세요 ChatGPT, Bard, Copilot. 윙윙, 윙윙, 윙윙 소리가 난다. 첫 번째 라운드가 성공하지 못한 경우 사용자가 굴복할 때까지 다시 시도하세요. 이제 우리는 동일하지만 다른 새로운 AI 기술을 도처에 갖고 있습니다. "완전 자연적인" AI를 사용한 이 새로운 실험이 성공할 수 있을까요? 할 것 같지 않은. 현대의 화신은 뭐라고 부르든 사랑스러운 이미지를 만들고, 프로처럼 텍스트를 뿜어내고, 놀라운 마법 같은 일을 할 수 있지만, 결국 유용하려면 정확한 입력이 필요하고, 정확하려면 유용한 데이터가 필요합니다. 그리고 인간은 무작위성과 자기 역설의 전형이기 때문에 이를 해결할 수 있는 컴퓨팅 성능은 없습니다. 그러나 우리는 보게 될 것입니다. 내가 이런 새로운 것들을 잊어버렸다고 생각했지, 그렇지? 조심하세요.
건배.