의역
의역(paraphrase) 또는 바꿔 말하기(rephrase)는 원래의 의미를 유지하면서 텍스트를 다른 말로 표현하는 것이다.[^1] 의역은 아이디어를 전달하는 데 있어 명확성과 효과를 높일 수 있다. 이는 원문과 동일한 개념을 새로운 방식으로 표현하는 것을 포함한다. 예를 들어, 누군가가 들은 이야기를 다시 전할 때, 의미를 보존하면서 자신의 말로 의역하는 것이다.[^1] 이 용어는 라틴어 *''*에서 유래하였다. 의역하는 행위를 paraphrasis라고도 부른다.
역사
의역은 구전 전통에서 널리 사용되었을 가능성이 높지만, 문헌상으로는 적어도 로마 시대까지 거슬러 올라가며, 당시 퀸틸리아누스가 학생들을 위한 언어 훈련으로 이를 권장하였다. 이러한 관행은 중세까지 이어졌으며, 제프리 오브 빈소프와 같은 인물들이 학생들의 언어 능력을 향상시키기 위한 교육 훈련에 의역을 포함시켰다. 의역에 대한 연구는 표절 문제와 독창적 저작의 중요성으로 인해 그 중요성이 높아졌다.[^5]
유형
프레드 잉글리스는 교육 목적의 다섯 가지 패러프레이징 수준을 다음과 같이 제시한다:[^6][^7] #단어를 동의어로 대체하기 #문장 구조 변형하기 #정보의 순서 재배열하기 #긴 문장을 여러 짧은 문장으로 나누기 (또는 그 반대) #추상적 개념을 보다 구체적으로 표현하기.
일부에서는 패러프레이징에서 동의어를 사용하는 것이 유용한 학습 도구가 될 수 있다고 보지만, 표절을 피하기 위해 학생들에게 문장 구조를 재구성하는 방법을 가르치는 것이 중요하다.[^8] 영어 학습자를 대상으로 한 연구에 따르면, ESL 학생들은 패러프레이징 시 문장 구조를 변경하기보다 동의어에 의존하는 경향이 있는 것으로 나타났다. 베트남 ESL 학습자들을 대상으로 한 연구에서는, 문장 구조를 변경하면 의미가 달라질 수 있다는 우려 때문에 동의어 사용을 선호하는 것으로 밝혀졌다. 나(Na)와 마이(Mai)는 ESL 교사들이 구문 수정을 포함한 다양한 활동을 수업에 통합하여 학생들의 패러프레이징 능력을 향상시킬 것을 권장한다. 또한 학생들이 효과적으로 패러프레이징을 연습할 수 있도록 쉽게 이해할 수 있는 원문 텍스트를 제공해야 한다.[^9]
자연어 처리 연구자들은 인간이 텍스트를 어떻게 다시 표현하는지 연구하기 위해 다양한 (원자적) 패러프레이즈 유형을 식별하였다. 이러한 패러프레이즈 유형은 유사한 의미를 전달하기 위해 텍스트를 변형하는 서로 다른 방법을 나타내는 여섯 가지 주요 그룹으로 분류할 수 있다:[^10][^11][^12][^13]
- 형태론 기반 변화
- 어휘 기반 변화
- 어휘-통사론 기반 변화
- 통사론 기반 변화
- 담화 기반 변화
- 극단적 변화.
형태론 기반 변화는 동사 시제나 명사 수 변경과 같이 단어의 형성을 변형하는 것을 포함한다. 예를 들어, "walks"를 "walked"로 바꾸는 것은 동사 시제를 조정하는 형태론적 변화이다. 어휘 기반 변화는 문장 구조를 크게 변경하지 않으면서 단어를 동의어나 밀접하게 관련된 용어로 대체하는 것을 포함한다. 예를 들어, 문장에서 "quick"을 "fast"로 바꾸면 유사한 속도 속성을 전달한다. 어휘-통사론 기반 변화는 어휘 수정과 문장 구조 변경을 결합한 것이다. 예를 들어, "The cat chased the mouse"(고양이가 쥐를 쫓았다)라는 능동태 문장을 "The mouse was chased by the cat"(쥐가 고양이에 의해 쫓겼다)이라는 수동태 문장으로 변환하는 것은 문장 구조와 일부 단어를 모두 변경하는 것이다. 통사론 기반 변화는 개별 단어보다 문장 구조에 초점을 맞춘다. 예를 들어, 원래의 의미를 유지하면서 복잡한 문장을 두 개의 단순한 문장으로 분해하는 것이 이 범주에 해당한다. 담화 기반 변화는 사실적 내용을 변경하지 않으면서 단락 내 논점의 순서를 재배열하거나 논증 제시 방식을 수정하는 것으로, 전체적인 텍스트 구조에 영향을 미친다. 극단적 변화는 텍스트에 상당한 변형을 가하여, 새로운 정보를 추가하거나 필수적인 세부 사항을 생략할 수 있으며, 이로써 기존 패러프레이징의 경계를 확장한다.
기계 학습 모델은 높은 의미적 유사성과 다양한 구문과 같은 특정 특성을 갖춘 패러프레이즈를 생성하도록 개발되었다.[^14][^15] 이러한 모델은 구문과 같은 언어적 변이를 강조하는 단순화된 패러프레이즈를 제공하여 언어 학습자를 돕는 등 다양한 응용 분야를 가진다. 대학에서는 이러한 모델을 활용하여 학생들의 과제를 분석하고 표절 탐지를 위한 내용 유사성을 검출할 수 있다.[^16][^17][^18] 또한 구문 및 어휘 변경과 같은 다양한 유형의 패러프레이즈는 특정 언어적 측면에서 프롬프트를 조정하여 모델 성능을 향상시키기 위한 프롬프트 엔지니어링에 활용된다.[^19][^20][^21]
분석
패러프레이즈는 텍스트의 의미를 명확히 하거나 설명하기 위해 다시 서술하는 것이다.[^22] 예를 들어, 원문이 "신호가 빨간색이었다"라고 한다면, 이를 "빨간 신호등이 켜져 있어 열차가 통과할 수 없었다"로 패러프레이즈할 수 있다. 패러프레이즈는 발화 동사(verbum dicendi), 즉 패러프레이즈로의 전환을 알리는 선언적 표현과 함께 도입될 수 있다. 예를 들어, "저자는 '신호가 빨간색이었다'고 말한다, 즉, 열차가 진행할 수 없었다"에서 즉은 뒤따르는 패러프레이즈를 알리는 역할을 한다.
패러프레이즈가 반드시 직접 인용과 함께할 필요는 없다.[^23] 패러프레이즈는 일반적으로 출처의 진술을 맥락에 맞게 배치하거나, 그것이 등장한 맥락을 명확히 하는 역할을 한다.[^24] 패러프레이즈는 보통 요약보다 더 상세하다.[^25] 출처는 문장 끝에 추가되어야 한다: 신호가 빨간색일 때 열차는 갈 수 없었다 (위키백과). 패러프레이즈는 원문의 본질적 의미를 보존하려고 시도할 수 있다.[^26][^27] 따라서 출처 자체에 명시적으로 드러나지 않는 의미를 추론하기 위해 (의도적이든 아니든) 출처를 재해석하는 것은 패러프레이즈가 아닌 "독자적 연구"에 해당한다. 출처의 "형식적 등가"를 나타내는 메타프레이즈와 달리, 패러프레이즈는 출처의 "역동적 등가"를 나타낸다. 메타프레이즈가 텍스트를 문자 그대로 번역하려 하는 반면, 패러프레이즈는 원문에 표현된 본질적 사상을 전달한다—필요한 경우 문자적 충실성을 희생하더라도. 자세한 내용은 역동적 등가와 형식적 등가를 참조하라.
자신의 말로
"자신의 말로"라는 표현은 필자가 자신만의 고유한 문체로—자신이 직접 그 아이디어를 만들었다면 표현했을 방식으로—텍스트를 다시 서술했음을 나타내기 위해 흔히 사용된다.[^2] 현재 자연어 텍스트에서 패러프레이즈를 이해하고 식별하기 위한 모델이 존재한다.[^3] 또한 텍스트 간소화 소프트웨어를 사용하여 문장을 자동으로 패러프레이즈할 수 있다.[^4]
은코 문자
은코 문자는 "간접 인용을 나타내기 위해 한 쌍의 구두점, U+2E1C ⸜ 왼쪽 하단 패러프레이즈 괄호와 U+2E1D ⸝ 오른쪽 하단 패러프레이즈 괄호를 사용한다."[^28]
같이 보기
- 자동 패러프레이징
- 텍스트 간소화
- 로제팅
- 위키백과:유사 패러프레이징
참고 문헌
[^1]: Stewart, Donald. 은유와 패러프레이즈. (1971)
[^2]: cite web url=http://www.open.ac.uk/skillsforstudy/writing-in-your-own-words.php title=자신의 말로 글쓰기 publisher=The Open University access-date=July 27, 2012
[^3]: Figueroa, Alejandro. 커뮤니티 질의응답을 위한 쿼리 로그에서 효과적인 패러프레이즈 순위 학습
[^4]: Shardlow, Matthew. "[https://web.archive.org/web/20180302163823/https://pdfs.semanticscholar.org/1f50/efc8e572397e58a7b3a2021da737225fecc5.pdf 자동 텍스트 단순화에 대한 개관]." Internationa
[^5]: D'Angelo. 패러프레이즈의 기술. (October 1979)
[^7]: Inglis, Fred. 교육의 핵심 개념. SAGE Publications
[^8]: Ruiter, Rik. E.S.L.로 가는 고속도로. iUniverse
[^9]: 학술 글쓰기에서의 패러프레이즈: 베트남 영어 학습자 사례 연구
[^10]: Kovatchev, Venelin. ETPC - 확장된 패러프레이즈 유형론과 부정으로 주석된 패러프레이즈 식별 말뭉치. European Language Resources Association (ELRA). (2018)
[^11]: Levin, Beth. 영어 동사 부류와 교체: 예비 조사. University of Chicago Press. (1993)
[^12]: Milicevic, Jasmina. 패러프레이즈. (2011-11-10)
[^13]: Vila, Marta. 패러프레이즈 유형을 이용한 말뭉치 주석: 새로운 주석 체계와 주석자 간 일치도 측정. (2015-03-01)
[^14]: Bandel, Elron. 품질 제어 패러프레이즈 생성. Association for Computational Linguistics. (2022)
[^15]: Wahle, Jan Philip. 2023년 자연어 처리 경험적 방법론 학회 논문집. Association for Computational Linguistics. (2023)
[^16]: Wahle, Jan Philip. 신경 언어 모델은 훌륭한 표절자인가? 신경 패러프레이즈 탐지를 위한 벤치마크. (2021)
[^17]: Wahle, Jan Philip. 2022년 자연어 처리 경험적 방법론 학회 논문집. Association for Computational Linguistics. (2022)
[^18]: Hunt, Ethan. 패러프레이즈 식별을 위한 기계 학습 모델과 표절 탐지에의 응용. (2019)
[^19]: Leidinger, Alina. 프롬프팅의 언어: 어떤 언어적 속성이 프롬프트를 성공적으로 만드는가?. (2023)
[^20]: Wahle, Jan Philip. 2024년 자연어 처리 경험적 방법론 학회 논문집. Association for Computational Linguistics. (2024)
[^21]: Linzbach, Stephan. 2024년 북미 전산언어학회 학회: 인간 언어 기술 (제1권: 장문 논문) 논문집. Association for Computational Linguistics. (2024)
[^22]: Fenceroy, Edna. 회복적 대화를 통한 갈등 최소화: 태도 변화를 통한 삶의 변화. WestBow Press. (2011-11-01)
[^23]: Lohumi, Shama. 간호사를 위한 의사소통 영어, 제3판 - 전자책. Elsevier Health Sciences. (2021-09-22)
[^24]: Ganguly, Amit. 영어 의사소통: 전자책. SBPD Publications. (2018-07-11)
[^25]: 인용, 패러프레이즈, 요약의 사용 시점 결정 - 휴스턴-빅토리아 대학교
[^26]: Lohumi, Shama. 간호사를 위한 의사소통 영어, 제3판 - 전자책. Elsevier Health Sciences. (2021-09-22)
[^27]: QuillBot 프리미엄. (2021-10-26)
[^28]: 유니코드 핵심 사양, "은코" § "구두점" https://www.unicode.org/versions/Unicode17.0.0/core-spec/chapter-19/#G18895