Waiting for a digital therapist: three challenges on the path to psychotherapy delivered by artificial intelligence
Abstract
Purpose
본 논문의 목표는 앞으로 CAI 시스템이 심리 치료를 제공할 수 있는 능력을 개발하는 데 있어 가장 중요한 장애물이 무엇인지 조사하는 것
. 이를 위해 우리는 이 임무의 핵심이 되는 세 가지 도전 과제를 제시하고 논의합니다.
Challenge
첫째, 인간이 제공하는 심리 치료가 효과적인지를 깊이 이해하지 않는 한 효과적인 AI 기반 심리 치료를 개발할 수 없을 수도 있다.
둘째, 치료적 관계를 구축하는 것이 필요하다고 가정하는 경우, 심리 치료가 비인간 요소에 의해 전달될 수 있는지 여부가 명확하지 않다.
셋째, 심리 치료를 수행하는 것은 좁은(narrow) AI에게 너무 복잡한 문제일 수 있다. 즉, 비교적 단순하고 명확하게 정의된 작업만 처리할 수 있는 AI다. 이 경우, 우리는 일반 또는 인간과 유사한 AI가 개발될 때까지 CAI가 완전한 심리 치료를 제공할 수 있다고 기대해서는 안 된다.
Introduction
BackGround & 최근 동향
최근 몇 년간 AI는 정신 건강 의료의 여러 영역에 적용되기 시작했다. AI 기반 솔루션은 우울증 및 조현병의 진단을 개선하고, 치료 결과를 예측하는 데 사용된다. 지능형 로봇은 자폐 스펙트럼 장애를 가진 어린이와 치매를 앓고 있는 노인들과 함께 작동한다. 가상 현실 아바타는 환자들이 청각 환각에 직면할 수 있도록 돕는다.
AI 기술의 구현이 특히 도전적이면서도 유망한 정신 건강 의료 하위 분야 중 하나는 심리 치료 또는 "대화 치료"이다. 대부분의 치료 전통의 대표들이 모두 동의하는, ‘논란이 없는 대화 치료의 정의’를 찾는 것은 어려운 일이다. 그럼에도 불구하고, 첫 번째 근사치로, 우리는 미국 심리학 협회(APA)가 제시한 다음 설명에 참조할 수 있다. APA에 따르면 심리 치료는 다음과 같다:
환자와 치료자 간의 의사 소통으로서, 사람들이 (i) 감정적 고통에서 해방되도록 돕는 것, 즉 불안, 두려움 또는 우울증이 줄어들도록 하는 것, (ii) 삶에서 문제에 대한 해결책을 찾는 것, 즉 실망, 슬픔, 가족 문제, 직장이나 직업에 대한 불만족과 같은 것을 다루는 것, 그리고 (iii) 작업 생산성 및 개인 관계를 즐기는 데 방해가 되는 생각과 행동을 수정하는 것.
APA의 특성화는 "친구와 대화하는 것"과 치료를 구별한다. 치료자와 친구 모두 우리의 문제에 대해 듣고 싶어할 수 있지만, 치료사는 "심리적 문제를 이해하기 위해 특수 교육과 경험을 가진 전문가"이다. 또한, 우정과 대조적으로, 치료는 비대칭적이며, 오직 클라이언트의 복지에 초점을 맞춘다. 마지막으로, 치료는 구조화된 환경에서 이루어진다. 일반적으로 환자와 치료사 사이에는 정기적인 만남 시간, 각 회의의 길이 등에 대한 합의가 있다.
일부 저자들은 LLM을 기반으로 한 CAI의 능력에 대해 조심스러운 접근을 취하는 반면, 다른 저자들은 적절한 프롬프트가 제공되면 CAI가 복잡한 추론을 수행하거나 심리학자가 이야기하는 것과 유사한 능력을 나타낼 수 있다고 주장한다. 이것은 CAI가 곧 완전한 심리 치료를 제공할 수 있는 의미일까? 이것은 그리 간단하지 않습니다. CAI 시스템이 심리 치료를 제공할 수 있는 능력을 개발하는 과정에서 우리는 컴퓨터 알고리즘의 계산 능력이나 LLM의 훈련 데이터 세트를 단순히 확대하는 것으로 극복할 수 없는 문제와 장애물을 만날 것이다. 이 논문의 목표는 그 중 세 가지를 특징 짓는 것이다.
Purpose
- 첫 번째 문제: 혼란스러운(Confused) 치료사 이 문제의 핵심은 다른 치료 전통들이 종종 치료를 수행하는 동안 치료사가 무엇을 해야 하는지에 대해 다르게 이해한다는 것이다. 이러한 논쟁에도 불구하고, 효과적인 심리 치료가 무엇인지에 대한 이해는 AI 기반 심리 치료의 개발을 위해 필수적이다.
- 두 번째 문제: 비인간(Non-human) 치료사 심리 치료는 전통적으로 두 사람 (또는 그 이상)의 관계 내에서 이루어진다. AI를 사용하여 심리 치료를 제공하는 것이 가능한지 여부에 대해 의심이 있다. 예를 들어 신뢰, 공감, 존중, 상호 이해 등과 같은 구성 요소로 분해할 수 있으며 이후에 AI가 이를 흉내 낼 수 있을까?
- 세 번째 문제: 좁은 지능(Narrowly Intelligent) 치료사 현재의 좁은 AI 기술로는 심리 치료에 필요한 복잡한 작업을 수행할 수 없을 수도 있다. 우리가 일반적인 AI를 먼저 구축하지 않는 한 (즉, 인간처럼 지능을 무제한으로 적용할 수 있는 AI를 구축하지 않는 한) 완전한 심리 치료를 제공할 수 있는 CAI 시스템을 개발할 수 없을 수도 있다.
Existing mental health chatbots
mental health chatbots
정신 건강 챗봇은 사람과 실시간으로 상호 작용하여 인간-인간 대화를 모방하는 방식으로 설계된 대화 시스템이다. 정신 건강 챗봇이 어떻게 작동하는지 더 잘 이해하기 위해 Woebot 중 하나인 가장 인기 있는 최고급 챗봇 중 하나와의 대화 일부를 더 자세히 살펴볼 것이다. 이 챗봇은 인지 행동 치료 (CBT) 원칙을 구현하기 위해 설계되었다.

이 짧은 대화에서도 Woebot은 실제 치료 세션의 많은 요소를 모방한다. 인간 치료사가 하는 것처럼 사용자를 올바르게 이해했는지 확인하고 사용자의 경험을 정상화시킨다 ("슬픔은 가장 작은 일들도 오르막길처럼 만들 수 있습니다") 그리고 치료 동맹의 형태를 제안한다 ("우리는 함께 이겨낼 수 있습니다"). 또한 생각이 감정에 영향을 미친다는 사실과 우리의 뇌가 인식적 오류에 빠지는 것을 설명함으로써 심리 교육의 요소를 제공하고, "자동 부정적인 생각"이라는 개념을 "악당이나 괴롭히는 자"로 비유함으로써 개요를 제공한다. 마지막으로 왜곡된 생각을 "잡아내고," "확인하고," "변화시키는" 과정인 인지 재구조화의 주요 치료 과정 중 하나의 기본 아이디어를 소개함으로써 인지 재구조화의 과정을 소개한다. 대화의 계속된 과정에서 Woebot은 사용자가 특정한 생각의 기저에 있는 왜곡을 인식하고 수정하도록 안내한다. 마지막으로 Woebot은 사용자에게 이러한 왜곡을 생략한 방식으로 생각을 다시 정제하도록 초대하여 인지 재구조화 과정을 짧게 마무리한다.
저자들의 초점 : 정신건강 챗봇이 정확히 무엇을 하는가?
치료용 CAI에 관한 리뷰 논문에서 정신 건강 챗봇의 기능 중에는
- "증거를 기반으로 한 심리적 개입 제공"
- "인지 행동 치료(CBT) 제공"
- "[챗봇의] 가장 일반적인 사용은 치료, 교육 및 검사의 제공이었다"
고 언급한다. 이러한 챗봇을 개발하는 기업들은 이제 점점 더 서비스를 정신 분석치료로 특성화하지 않도록 조심하고 있다. 예를 들어, Woebot의 웹사이트에서 Woebot은 "개인의 정신 건강 동반자"로 소개된다. 이것은 치료사가 아니라는 것을 의미한다. 그러나 동일한 웹사이트에서 Woebot은 "대화형 및 사용하기 쉬운 치료 솔루션을 통해 개별 지원을 제공한다"고 언급하고 있으며 "여기에는 약속이나 대기실이 없습니다"라는 말은 명백히 Woebot을 찾아가는 것이, 예를 들어 자기 도움서를 사용하는 것과 대조된다. 비슷한 방식으로, 이 분야의 다른 인기 있는 제품 중 하나인 Wysa는 "증거에 기반한 인지행동 기법(CBT)을 활용하여 사용자가 들여다볼 수 있도록 하는 인공지능 챗봇"으로 소개된다. 이렇게 하면 치료적 기법을 "활용"하는 것이 "사용"하는 것과 동일한지, 그리고 치료적 기법을 사용하는 것이 정신 분석 치료를 제공하는 것과 같은지는 명확하지 않다. X2 Foundation이 개발한 또 다른 인기 있는 제품 Tess를 사용하는 이점 중에는 "효과적인: 대부분의 사람들이 전통적인 치료보다 Chat With Tess를 선호한다고보고..." 및 "저렴한 가격: Tess의 지원은 대면 치료보다 98% 싸다"가 포함되어 있다. 다시 말해 Tess를 "치료사"라고 명시적으로 부르지 않더라도 X2 Foundation은 명백히 자사의 챗봇 사용을 인간이 제공하는 정신 분석 치료에 참여하는 것과 비교할 수 있는 것으로 여기고 있다.
예측 가능한 미래에는 챗봇이 인간이 제공하는 정신 분석 치료의 보충재로 사용되어야 할 것이다. 반면에 사용자의 정신 건강 증상을 줄이고 사용자의 웰빙을 향상시키는 기존의 정신 건강 챗봇의 효과성이 점점 커지고 있는 것을 고려할 때, 몇 년 안에 챗봇과의 상호작용을 정신 분석 치료라고 부를 수 있는 조건과 극복해야 할 문제를 고려하는 것이 타당할 것이다. 이것이 이 논문의 나머지 부분의 목표다.
The problem of a confused therapist
다양한 심리치료 접근법
심리치료 분야는 결코 하나의 치료법만 있는 것이 아니다. 현재 500가지 이상의 다양한 심리치료 접근법이 있다고 추정되어진다. 이러한 접근법 대부분은 심리치료의 주요 전통 중 하나에 속하며, 예를 들어 정신분석적/심리역학적, 존재주의, 개인중심적, 행동주의, 인지주의 등이 있다. 이러한 전통에 기반한 원칙들은 어느 정도 서로 호환되어 있어서 하나 이상의 전통에서 이점을 취하는 치료 모드를 만들 수 있었다. 여기에는 인지행동치료(CBT)가 대표적인 예다. 이러한 전통의 원칙들은 서로 거리가 멀기 때문에 (예: 정신분석적 전통과 행동주의 전통) 생각할 때, 그들을 생산적으로 결합하는 것은 훨씬 더 어렵다.
다른 치료 전통은 인간의 정신적 고통을 서로 다르게 개념화 하는데, 예를 들어 정신분석적 전통은 미해결된 내부 갈등에 초점을 맞추고, 인지주의 전통은 부적응적인 신념과 사고 패턴에 초점을 맞춘다. 이러한 이론적 차이는 다시 말하면, 다른 임상 과정과 기술의 집합으로 이어진다. 정신분석가가 자유 연상, 꿈 해석 또는 전이 분석을 사용하여 내담자와 작업할 것으로 예상할 수 있지만, 인지행동치료사는 주로 인지 재구조화 또는 노출과 같은 도구를 사용할 것입니다. 요약하면, 특정한 치료 지향은 치료사의 "클라이언트의 경험과 행동에 대한 가설을 형성하는 방법, 특정 치료 개입에 대한 이론을 형성하는 방법, 그리고 계속되는 치료 과정을 평가하는 방법"에 영향을 미친다.
또한 지난 100년 동안 전체 분야에 걸친 질문이 계속되어 왔는데, 그것은 다양한 심리치료 지향 (그것들이 효과적인 경우)이 특정 기능들 덕분에 효과적인 것인지, 아니면 "공통적인" 또는 "비특정" 요인들 덕분에 효과적인지에 관한 것이다. Rosenzweig의 발표 이후, 다양한 저자들이 다양한 치료가 특정 기술에 관계없이 다양한 치료를 효과적으로 만드는 것으로 여겨지는 공통적인 요인들의 목록을 제안했다. 예를 들어, (i) 치료사와 클라이언트/환자 간의 치료적 관계, (ii) 치료적 성공에 대한 기대, (iii) 클라이언트가 심리적으로 직면하거나 문제에 직면하는 것, (iv) 문제를 통제하거나 다루는 경험, 그리고 (v) 치료적 성공 또는 실패를 내부 원인 (예: 클라이언트의 대처 기술의 변화)으로 귀속시키는 것과 같은 공통적인 요인들에 대해 논의한다.
이어지는 문제
이것은 완전한 AI 기반 심리치료로 향하는 우리의 여정에서 첫 번째 문제로 이어진다:
혼란스러운 치료사의 문제: 우리가 심리치료 과정의 필요한 구성 요소와 심리치료를 효과적으로 만드는 요인들에 대한 우리의 제한된 이해를 감안할 때, 우리는 효과적인 심리치료를 수행할 수 있는 인공 시스템을 개발할 수 있는가?
전반적으로 미래의 치료사를 어떻게 교육할지에 대한 동일한 문제를 직면하고 있다. 그들은 어떤 지향을 선택해야 할까? 인지행동, 게슈탈트, 또는 정신역학치료사가 되어야 할까? 아니면 다른 다양한 옵션에서 무언가를 선택해야 할까?
인공 치료사를 개발하는 경우, 특정 치료 모드의 원칙을 하드웨어에 넣거나 특정 치료 모드가 구현된 세션 데이터를 사용하여 AI 알고리즘을 교육함으로써 이러한 결정을 내려야 한다. 게다가, 성공적인 심리치료에서 비롯된 데이터를 기반으로 알고리즘을 교육하고자 한다면, 심리치료에서 "성공"을 어떻게 이해하고자 하는지 결정해야 할 것이다. 증상의 감소일까? 그렇다면, 어떤 증상이며 어떤 척도로 측정할까? 아니면 클라이언트의 기능 및 일반적인 웰빙의 개선과 동일하다고 여기는 것이 더 좋을까?
대부분의 치료사들은 다양한 치료 지향의 방법을 합쳐서 사용한다. 인공 치료사도 통합적이거나 절충적이어야 할까? 그렇다면 원칙적으로 다양한 치료 전통에서 데이터를 교육해야 할까? 게다가, 각 치료사는 세션 중에 적용하는 특정 치료 기술 및 방법과 클라이언트의 자기 통제 감 및 통제에 대한 보다 일반적인 작업 사이에서 균형을 찾아야 한다. 인공 치료사의 경우에는 이러한 균형을 어떻게 달성해야 할까? 전문가들은 "치료 이론이나 시스템 없이는, 임상가들은 방향을 잃은 존재로서 실제로 수백 가지의 인상과 정보를 단일 세션에서 휩쓸리게 될 것입니다"라고 지적한다. 이것은 인공 치료사에 대해서도 동일하게 적용된다.
동시에, 정신 건강 챗봇 분야의 현황을 고려할 때, AI 기반 치료에 가장 유망한 치료 지향으로 간주되는 것은 CBT이다. 인지행동치료 전문가에 의해 제공되는 CBT는 다양한 진단의 치료에 효과적이다. 또한 CBT는 상대적으로 짧은 시간 내에 긍정적인 결과를 가져오는 치료 방법 중 하나이다. 게다가, CBT의 기본 아이디어인 "자기 관련적인 생각, 평가 및 신념이 정신병적 상태의 발달과 지속에 중요한 공헌자임"이라는 것은 간단하고 우아합니다. 따라서 많은 챗봇 개발자들의 가정은 챗봇이 사용자들이 부적응적인 인식을 식별, 도전 및 대체하는 데 도움이 되는 한, 그리고 몇 가지 추가적인 기술 및 마음의 훈련 및 행동 활성화와 함께, 그들이 CBT를 제공한다고 한다.
그러나 - 많은 심리치료사들이 제안할 것이다 - CBT의 경우에도 치료는 기술에 그치지 않는다. 이러한 관계는 "따뜻함, 정확한 공감 및 진정성"으로 특징 지어진다. 이것은 완전한 AI 기반 심리치료로 가는 길에 놓인 두 번째 문제로 이어진다.
The problem of a non-human therapist
non-human therapist problem
치료적 관계를 구축하는 것이 필요한 경우 non-human 요원이 정신 치료를 수행할 수 있을까?
대부분의 저자들에 따르면, 정신 치료라는 것은 특정 기술의 전달 그 이상의 것, 바로 대인 관계(interpersonal relationship)이다. 이 점이 완전한 AI기반 정신 치료의 가능성에 대한 우려를 제기한다.
문제를 해결하기 위한 세 가지 실용적인 전략
- Deflation(폭로)
치료적 관계의 역할을 축소하는 것이다.
우리는 정신 치료를 인간이 포함되는 것으로 생각해 왔기 때문에 정신치료가 치료적 관계를 포함한다고 생각했지만 미래의 정신 치료의 현실을 다를 수 있으며 우리는 치료적 관계가 정신 치료 과정이 발생하기 위해 필수적이라는 기존 기준에 고수해서는 안된다. 예를 들어 치료적 관계를 구축할 수 없지만 artificial therapist는 인간 치료사보다 훨씬 더 숙련되고 일관성 있게 치료기술을 전달할 수 있으므로 적어도 인간 치료사만큼 효과적일 수 있다.
- Mimicry(흉내)
이 전략에 따르면 중요한 것은 치료적 관계가 있는지의 여부가 아니라 클라이언트가 그런 관계가 있다고 생각하는지의 여부이다. 모방은 현대 챗봇 개발의 기본 전략이다.
해당 문맥에서, 치료적 관계의 무거운 개념에서 다소 기술적인 치료적인 동맹(alliance)으로서의 개념으로 중점이 이동되는 경우가 많다. 고전적 특성에 따르면 치료적 동맹은 (a) 치료적 목표에 대한 합의, (b) 치료적 과제의 할당, 그리고 (c) 유대 관계의 발전으로 구성된다. 진정한 치료적 관계(따뜻함, 공감 및 수용을 기반으로 함)를 CAI와 달성하는 것이 불가능할 수도 있지만, 적어도 치료적 동맹의 일부 측면은 챗봇과의 상호 작용에서 재구성될 수 있다.
또 하나 검토할 가치 있는 문제는, 모방이 초기에 사용자의 참여를 증가시킬 수 있지만, 상황이 좋지 않을 때와 사용자의 노력에도 불구하고 상황이 개선되지 않을 때에는 해로운 효과를 낼 수도 있다는 것이다. 이러한 경우에 누군가가 관심을 가진 것처럼 느끼는 것만으로 충분하지 않을 수 있다. 또한, 치료적 관계를 성공적으로 모방하는 것은 매우 어려울 수 있다. 왜냐하면 이것은 다양한 측면과 정도를 포함하기 때문이다.
- Emulation(에뮬레이션)
- human-human 치료적 관계를 여러가지 간단한 구성요소 또는 활성 성분으로 분석할 수 있는지 조사 ex) 공감, 신뢰, 긍정적 인식, 목표의 조화, 이해
- 이러한 구성요소를 human-AI상호 작용에서 재구성해야한다. (매우 어려움)
두 단계로:
공감을 예로 들어 보겠습니다. 일부 저자들은 기계나 챗봇이 사람들과 공감할 수 있는 것이 가능하다고 주장합니다. 다른 사람들은 이러한 낙관론이 "공감적 행동"과 동일시됨으로써 발생한다고 지적합니다. 그러나 인공 에이전트를 개발하는 동안 우리가 공감의 행동적 측면에만 집중하여 감정적 및 현상적인 측면과 같은 모든 다른 측면을 무시한다면, 아마도 우리는 더 정교한 모방 형태를 개발하는 것이며, 따라서 전략 세 가지가 전략 두 가지로 붕괴될 것입니다.
The problem of a narrowly intelligent therapist
Narrowly Intelligent Therapist 문제
상상해보세요. 복잡한 사회적 게임에서 여러분은 파트너와 함께 행동을 조율하여 이전에 설정한 공통 목표를 달성해야 합니다. 이 게임에서 이기기 위해서는 여러 보조 작업(또는 미니 게임)에서 뛰어나야 합니다. 예를 들어, 파트너가 말하는 내용을 정확하게 이해해야 하며, 그들이 하는 인지적 오류를 인식하고 수정 방안을 제안해야 합니다. 그들의 감정을 적절하게 파악하고 반응해야 합니다. 등등. 큰 게임에서 성공하기 위한 미니 게임 목록은 길지만 폐쇄됩니다. 새로운 시나리오는 있을 수 있지만 그에 따른 새로운 게임은 없습니다. 마지막으로, 각 미니 게임은 잘 정의된 규칙 집합을 갖고 있으며, 언제든지 잘 하고 있는지 실패하고 있는지를 알 수 있습니다.
좁은 지능 치료사의 문제를 해결하기 위해서는 정신치료가 이런 복잡한 사회적 게임으로 해석될 수 있는지 해석해야한다… 정신 치료를 수행하기 위해서 존재하는 작업의 길고 폐쇄성 있는 특성을 고려하여 좁은 인공지능이 이것을 마스터 가능할까?
두번째 측면은 정신 치료에 대한 이론적 사고의 근본을 더 깊게 파고들고 있다. 완전한 형태의 정신치료를 수행할 수 있는 에이전트가 모든 이야기에 대해 의미있는 대화를 나눌 수 있어야한다면, 좁은 인공지능이 할수는 없을 것이다. 더 구체적인 기술 측면에서도 딜레마를 만들어 내는데, 바로 대화 시스템 딜레마이다.
대화 시스템 딜레마: 우리는 시스템이 일반적인 목적을 가지고 있지만 사용자와의 상호 작용이 제어되지 않고 예측할 수 없는 것을 원하는가, 아니면 상호 작용이 예측 가능하고 제어 가능하나 특정하고 좁은 정의된 작업을 수행하는 데 제한되는 것을 원하는가?
현대의 정신 건강 챗봇은 정확히 간단한 프레임 기반 시스템으로 사용자를 내장된 치료 개입이나 운동의 미리 정의된 단계를 안내한다. 사용자로부터 스크립트되지 않은 자연어 입력이 가능한 곳이 있는 경우 챗봇은 그것을 대강 정의된 사전 정의된 범주 중 하나로 분류해야 한다. 이것은 챗봇이 사용자의 입력에 적절하게 반응할 수 있는 능력을 심각하게 제한합니다.
미래에는 사용자가 가져올 수 있는 주제와 의도의 범위가 훨씬 넓은 범위로 인식될 수 있도록 챗봇을 기대할 수 있다. 아마도 사용자의 이전 입력에서 학습하여 더 적절하게 응답하는 데 도움이 되는 기능도 갖추게 될 것이다. 그러나 우리가 우리의 ANI가 주로 특정한 치료 기술을 구현하길 원한다는 한, 그들이 참여할 수 있는 주제와 작업의 범위를 엄격하게 제한해야 한다. 따라서 좁은 지능 치료사의 문제는 여전히 열려 있다. 이 문제를 고려할 때, 우리는 인공 치료사가 AGI와 동등한 기술적 참여 수준에 도달할 때까지는 불가능하다고 인정해야 할지, 아니면 "정신 치료"가 미래에는 오늘과 다른 의미를 갖게 될지를 인정할 수밖에 없을 것이다.
Conclusion
현재의 연구 결과는 정신 건강 챗봇이 적어도 일부 사용자에게 매우 도움이 될 수 있다는 것을 분명히 보여주지만, 본 논문의 목표는 완전한 형태의 인공 지능 기반 심리 치료를 개발하는 과제의 범위를 개요로 제시하는 것이었습니다. 우리는 이 개요를 인공 치료사와의 첫 예약을 예약하기 전에 직면해야 할 세 가지 주요 문제의 형태로 제시했습니다. 우리는 미래에 각각의 이러한 도전을 어떤 방식으로든 극복될 것으로 보고 있습니다. 그러나 그 전에는 심리 치료 과정에서 인공 지능이 수행할 수 있는 역할의 한계에 대해 정직하고 명확하게 인식하는 것이 중요합니다.