네이버 한자사전 표제어 서체 자동 변경 오류

category 꼬마 펭귄 걸음마 | Posted by 오씨 부부 | 2019/06/24 18:30


 

리눅스에서 네이버 한자사전을 이용해 한자를 검색하면 일부 글자가 우리가 사용하는 정자체(번체자)로 일단 표시된 뒤 1초 정도 후에 간체자로 자동 변환하는 현상이 발생합니다. 아래 자료 화면처럼 모든 한자가 다 그런 건 아닙니다. 나라 국자의 경우 정자체가 제대로 표시되지만 더할 익자의 경우 정자에서 간체자로 변합니다.

 

후자의 경우 간체자와 약자가 모양이 같긴 하나, 오랫동안 네이버 한자사전을 이용하면서 다른 글자들의 검색 결과를 많이 접해보니 한국과 일본에서 많이 쓰는 약자가 아니라 중국에서 쓰는 간체자로 검색 결과(표제자)가 자동으로 변한다고 해야 정확할 것 같습니다. 본토가 아닌 곳에서 간체자의 영향력이 커진다면 대만-홍콩 문제에 직면한 시진핑에게는 굿 뉴스일 수도 있으려나요? ㅎㅎ

 

아무튼 폰트 설치 문제는 아닙니다. 실제로 네이버 나눔 글꼴, 구글 Noto 글꼴 모두 설치되어 있고, OS와 웹 브라우저들의 글꼴 설정들도 여러 차례 확인하고 바꿔도 봤습니다만 해결이 안 되더군요. 현재 네이버측에 문제를 알린 상태입니다. 이 현상은 모든 환경에서 다 그런 것은 아니고 Windows–IE, iOS–Safari에서는 아무 문제가 없었습니다. 엉뚱한 주인 만나 아직도 순정 매버릭스 상태인 MacBook Pro의 경우 Firefox 최신 버전임에도 네이버 한자사전 이용시 간체자로 자동 변환되는 현상이 있습니다.

 

한편, 같은 리눅스 환경이라도 다음이 제공하는 한자사전의 경우 이런 현상이 벌어지지 않습니다. 네이버가 간체자를 쓰는 중국, 약자를 많이 쓰는 일본에 진출해 있다보니 아무래도 사전 서비스의 코딩에 뭔가 오류가 있는게 아닐까 생각합니다. 아래는 화면 캡춰입니다. deepin(데비안)과 우분투 계열 배포판 3종 등 모두에서 동일한 현상이 벌어집니다. 브라우저들도 가장 많이 쓰이는 것들이고, 심지어 네이버가 만든 웨일에서도 같은 현상이 일어납니다. 그놈의 Epiphany는 확인 안 해봤습니만, 오페라는 애초에 오픈 소스 방식으로 만들어지는 크롬을 포크한다고 하니 같은 현상이 아마 있을 것으로 보입니다. 안드로이드쪽은 기기가 없어서 잘 모르습니다.

 

 

구글 크롬

 

 

모질라 파이어폭스

 

 

네이버 웨일

 

 

맥 사파리

 

위의 화면을 보면, 우리 발음 에 해당하는 한자들을 검색할 경우 더할 익자가 중복되어 검색됩니다. 물론 중복 검색된 두 글자의 내용 분량이 서로 다르므로 중복 검색 자체는 한자 DB의 문제임이 분명합니다. 여기서는 일단 리눅스에서 돌아가는 여러 브라우저에서 같은 두 자가 모두 간체자로 변하는 게 확인된다는 게 중요합니다.

 

한편, OSX 10.9.5 Mavericks부터 MacOS Mojave에 이르기까지 사파리에서는 위 네 번째 화면처럼 한 글자만 간체자로 변하고 나머지 한 글자는 그냥 번체자로 남아있습니다. 우째 이런 일이 벌어지는지는 잘 모르겠네요. 암튼 네이버에서 수정하기 전까지 리눅스에서 한자 정자체를 제대로 보려면 다음 한자사전을 쓰는 게 좋을 것 같습니다.

 

모든 환경에서 결과가 똑같이 나오도록 개발하는 것이 쉬운 일은 절대 아닐 것입니다. 나야 어차피 불편하지도 않은 데다 대체제도 있으니 상관 없으나, 한자나 동양 3국의 한자 문화에 능숙하지 않은 사람들한테는 꽤나 머리 아플 듯합니다.

 

사실 비슷한 일이 작년에도 있었습니다. HWP에 기본 설치되는 글꼴 중에 한자 오자 문제가 아직도 있습니다. 90년대 중반만 해도 해당 프로그램에 기본 제공되는 한자 자형에 비슷한 글자나 동자, 속자, 이체자, 약자 등등에서 꽤 많은 오자가 있었는데, 지금은 제법 많이 잡혔습니다. 문제는 HWP 2014년 버전에 가장 흔하디 흔하게 쓰는, 가장 기본적인 글자인 길 도자를 일부 폰트가 틀리게 표현한다는 것입니다. 그래서 작년에 문의를 보냈더니 간체자여서 그렇다는 짤막한 답변이 돌아온 겁니다. 어이가 없었습니다. 왜냐하면 길 도자에는 간체자가 없기 때문입니다. 단, 간혹 한중일 공히 한 획(점)을 빼기도 하지만 그건 활자 인쇄물을 위한 약자로 한자 문화권에서는 약자라 할 것도 없는 수준입니다.

 

사용자 삽입 이미지

 

한컴의 고객 서비스 담당자는 간체자가 있는 글자인지 아닌지 확인도 안하고 어디서 간체라는 말은 들어가지고 무성의한 답변으로 오히려 가르치려 들더군요. 문의하는 사람들도 바보가 아닌 이상 이것저것 알아보고 확인한다는 걸 모르는 모양입니다. 내가 지적한 글자는 위와 같습니다. 저 글자는 불필요한 점이 한 획이 더 찍혀 있습니다. 많은 이들이 인쇄용 고딕체 폰트나 명조체 폰트만 보다 보니 옛부터 써온 붓글씨는 오히려 낯설어 합니다, 인쇄용 고딕체나 명조체에 점이 두 개 찍혀 있으니 붓글씨를 최대한 반영한 폰트를 만들면서도 점을 두 개 찍게 된 것 같습니다.

 

그러나 한자는 활자라는 것이 만들어지기 2천 년도 더 전에 만들어진 글자입니다. 당연히 대량 인쇄 시대의 명조체나 고딕체와 같은 인쇄용 폰트를 판단의 근거로 삼아서는 안 됩니다. 그 오랜 세월 동안 책받침 부수에는 점이 하나만 찍혀 왔습니다. 그러나 오늘날 인터넷 세상에는 부수를 정확히 아는 글이 점점 줄어들고 있습니다. 오히려 서양식 서체 제작 방식이 소개된 이후에 등장한 대량 인쇄용 조판 서체와 컴퓨터 등장 이후 한자의 본래 서체를 활용한 디지털 폰트를 비교하는 엉뚱한 글들마저 등장하여 많은 이들을 헷갈리게 하고 있습니다. 조금만 생각해 보면 알 수 있는데 말이죠.

 

위의 글자는 명백히 오자이고 그걸 한컴측에 지적해 준 것입니다. 필요없는 점이 하나 더 들어가 있고, 이는 수많은 천자문 사이트를 검색해서 찾아보면 바로 알 수 있습니다. 다른 글자도 아니고 가장 많이 쓰고, 인명으로도 흔히 쓰는 글자이며, 말 그대로 한자의 육서법 중 정서체인 해서체라 이름 붙인 폰트가 틀렸으니 30년 동안 한컴사에 정품값으로 100만 원도 더 쓴 사람이 가만 있으면 되겠습니까. 그런데 황당하게도 간자라는 겁니다. 한마디로 네가 모르는 거야~라는 대답인 거죠. 괘씸한 자들입니다. 무슨 간체자가 획 하나를 더 붙인다는 건지, 원. 그래서 중국 사이트와 국내 천자문 사이트들의 예를 첨부해서 보내줬는데, 모르겠네요, 폰트 개발회사인 한양시스템과 협의해서 고쳤는지 어쨌는지는.

 

한컴처럼 네이버의 답변도 재미있더군요. 판에 박힌 후렴구죠, IE 8.0 이상을 쓰거나 구글 크롬을 쓰세요, 고객님. 아니, 요새 누가 IE 8.0 이하를 쓴다고 그걸 답변이라고 하는지, 그리고 IE를 쓰라는 건 결국 윈도우 쓰라는 건데, 그럴 거면 웨일의 리눅스 버전은 왜 만들었는지 궁금하죠. 자기네들 같으면 주유구가 다르니 고객님 차를 바꾸세요라고 하는 주유소에 또 갈 건지 궁금합니다.

 

무엇보다 개발 환경부터가 데스크탑은 윈도우즈, 모바일은 iOS와 안드로이드에 편중되기 때문입니다. 그러나 전 세계로 나아가려면 비주류도 챙겨야 합니다. 그들도 몇 억은 되기 때문이죠. 다양한 비주류가 윈도우즈와 안드로이드로 대동단결한 5천 만 한국인보다 훨씬 많습니다. 우리가 다양성에 주목해야 하고, 소수자들을 품에 안아야 하는 이유는 우리가 자유를 누리고 욕구를 충족하며 살아야 하기 때문이기도 하지만, 어쩌면 그저 먹고 살아야 하기 때문이기도 합니다. 혹여 인권과 다양성에 대한 감수성에 둔감한 사람일지라도 후자의 이유에는 결국 동의하더군요.

 

아무튼 대기업의 담당자들이 늘어놓는 궤변을 들어야 하는 고객들은 무시당하는 느낌을 받는 경우가 많고, 그래서 일부의 사람들은 연줄 앞세워 영향력 행사하려 들거나 직함부터 말하면서 고압적인 자세를 갖게 되는 듯합니다. 서비스 현장의 프론티어들은 고객으로부터 뭔가 인상적인 느낌을 받지 않으면 일단 대충대충 매뉴얼대로 하고 맙니다. 그 매뉴얼이라는 것이 사람 참 열불나게 만들고요.

 

 

덧붙임

 

1. 오늘 네이버에서 답장이 왔는데, 처음에는 폰트 문제로 가볍게 생각한 모양이나 곧 그 정도의 문제가 아님을 뒤늦게 인지한 듯합니다. 상황을 파악하는 중이라는데, 내 생각엔 인코딩 관련 홈페이지 소스 코드 문제가 아닐까 합니다. (2019-6-26)

 

2. 오늘 네이버 사전팀이 OS와 웹브라우저들에 대한 상세한 테스트 결과를 포함한 2차 답장을 보내 왔습니다. 요약하면 폰트 렌더링과 관련된 문제라고 합니다. 지금 당장 고치기 보다는 예정된 일정의 개선 작업에 포함시켜 서비스 제공자측과 함께 논의하여 처리하겠다고 합니다. 예상했던 소스 코딩 문제는 아니었지만, 여하간 사소할 수도 있는 문제를 열심히 처리해 준 담당자들이 고맙군요. (2019-7-2)

 

진보블로그 공감 버튼트위터로 리트윗하기페이스북에 공유하기