'첫가끝'에 해당되는 글 2건

  1. 2010.01.05 옛한글과 텍스트 편집기
  2. 2010.01.02 난 판도라 상자를 열었을까?

ᄒᆞᆫ글 Character-Hanguel-0.gif Character-Hanguel-1.gif

위의 검정 글씨자주색처럼 보여야 합니다. 빨간색처럼 보이면 글꼴이 없거나 설정이 잘못된 경우입니다.

어떤 텍스트 편집기에서 우연히 ᄒᆞᆫ글을 복사하여 붙였다가 빨간색처럼 보이는 현상을 접한 뒤로 옛한글을 입력하지도 복사해 붙이지도 않은 기억이 난다. 아무튼 지금 다시 도전해 보려고 합니다.

목적

옛한글 입력은 힘들므로 우선 옛한글을 화면에 잘 나타내는 텍스트 편집기를 찾아 보자.

평가 항목

  1. 가변폭 글꼴이 가능한가? :
    • 대부분의 옛한글 글꼴가변폭 글꼴입니다. 따라서 텍스트 편집기에서 지원하는지를 먼저 살펴야 합니다.
    • 글꼴 목록에서 굴림체굴림이 함께 나타나면 됩니다.
  2. 유니코드 붙이기가 가능한가?
    • 유니코드, 정확하게는 UTF-8 문자셋으로 붙여넣기를 할 수 있는가? (Copy & Paste)
    • 참고로 윈도에서는 유니코드라고 부르는 것은 유니코드 리틀 엔디언입니다. 유니코드 빅 엔디언은 그냥 유니코드 빅 엔디언으로 표기합니다.
    • 예문에서 데이터를 읽어오게 됩니다.
  3. 유니코드저장할 수 있는가?
    • 2번에서 읽어온 예문을 UTF-8 문자셋으로 저장할 수 있는가를 평가합니다.
  4. 3번에서 자신이 저장한 파일에서 유니코드 자료를 읽어 올 수 있는가?
    • 이것도 역시 정확하게는 UTF-8 문자셋으로 저장한 파일을 읽어 올 수 있는가를 평가합니다.
  5. 3번에서 다른 프로그램에서 파일로 저장한 UTF-8 문자셋 자료를 읽어올 수 있는가?
  6. 5번에서 불러온 것을 다시 유니코드저장할 수 있는가?
  7. 4번에서 다른 텍스트 편집기에서 불러온 UTF-8 문자셋 자료를 복사하여 붙여넣기를 할 수 있는가? (Copy & Paste)
  8. 7번에서 붙여넣기 한 것을 다시 유니코드저장할 수 있는가?
  9. 위의 1~8번 과정을 가변폭 글꼴로 다시 시험합니다.

이때 당장은 유니코드의 여러 가지 형태를 모두 평가할 수는 없습니다. 따라서 달랑 두 가지만 따집니다. 하나는 유니코드 리틀 엔디언, 다른 하나는 UTF-8입니다. 특히 UTF-8에 중점을 두어 평가하게 됩니다.

저게 끝나면 오피스웨어도 점검을 해 봐야겠습니다.

평가 방법

위의 항목에 점수를 부여하게 됩니다. 그러나 항목 별로 약간의 차별을 두게 됩니다. 다만 1~8번을 따로 순위를 매기고, 9번은 따로 순위를 매깁니다. 9번을 따로 매기는 까닭은 설명하지 않아도 아시겠죠? 그리고 종합 순위는 9번 항목 때문에 매기지 않습니다. 사실상 텍스트 편집기의 성능 시험은 8번까지로 끝이라고 보시면 됩니다.

여기에서 미리 밝힐 사항은 윈도의 메모장읽기 쓰기가 모두 가능하며, 붙여넣기가 가능했습니다. 다른 프로그램이 저장한 자료도 거의 대부분 완벽하게 읽어왔습니다.

  • 1번 항목은 점수가 없습니다. 이것은 9번 항목을 위한 옵션이기 때문입니다.
  • 2번 항목은 10점입니다. 예문에 나타난 대로 보여주어야 합니다.
  • 3번 항목은 10점입니다. 단, 2번에서 정상적으로 붙여넣기를 하지 못한 경우에는 메모장의 파일 데이터로 대체하며, 그것을 불러와서 받은 점수에서 3점 감점합니다.
  • 4번 항목은 10점입니다. 저장한 뒤 그것을 불러온 뒤 복사하여 위키백과에 붙여넣기를 함으로써 정상적으로 보이는지를 검사합니다. 이는 데이터가 변형되더라도, 실제로 그 내용은 그대로 유지되는지를 알아보기 위한 것입니다.
  • 5번 항목은 제대로 불러온 것의 갯수에 3을 곱합니다. 다시 말해 5개의 프로그램에서 저장한 것을 불러오면 5 x 3 = 15점이 됩니다. 불러오더라도 이상이 있으면 감점 처리합니다.
  • 6번 항목은 저장한 뒤 메모장에서 불러오고, 그것을 다시 위키백과에 붙여넣기를 함으로써 정상적으로 보이는지를 검사합니다. 이는 데이터가 변형되더라도, 실제로 그 내용은 그대로 유지되는지를 알아보기 위한 것입니다. 역시 제대로 완료하면 편집기 하나당 3점을 배정합니다.
  • 7번 항목은, 화면에 잘 나타내 주면, 편집기 하나당 3점입니다.
  • 8번 항목은 6번 항목을 참조하여 점수를 매깁니다.

예문

위키백과옛한글 문서에 나타난 예문을 조금 고쳐서 사용합니다. 일부러 돋움 글꼴을 써서 옛한글을 깨지도록 했습니다.

<span class="jamocomposed_block" style="font-family: '돋움 옛한글','Dotum Old Hangul','바탕 옛한글','Batang Old Hangul','궁서 옛한글','Gungsuh Old Hangul','굴림 옛한글','NewGulim Old Hangul','은 자모 바탕 확장','Un Jamo Batang Ex','UnJamoBatangEx','은 자모 바탕','Un Jamo Batang','UnJamoBatang','은 바탕','Un Batang','UnBatang',Code2002,Code2001,Code2000,serif; font-size: 105%;">나랏말ᄊᆞ미 듀ᇰ귁에 달아 문ᄍᆞᆼ와로 서르 ᄉᆞᄆᆞᆺ디 아니ᄒᆞᆯᄊᆡ</span>

원문은 위와 같으나 실제로 사용하는 코드는 다음과 같습니다.

{{첫가끝|

나랏말ᄊᆞ미 듕귁에 달아 문ᄍᆞᆼ와로 서르 ᄉᆞᄆᆞᆺ디 아니ᄒᆞᆯᄊᆡ

}}

이는 듀ᇰ귁이라는 코드가 윈도 시스템 또는 글꼴에서 약간의 버그를 보이고 있어서 듀ᇰ라고 바뀌는 경우도 있기 때문입니다.

이것은 위키백과의 사용자 페이지에서 확인할 수 있습니다. 결국 아래 두 그림 가운데 한 가지의 형태를 따르면 됩니다.


텍스트 편집기 목록

간혹 이건 IDE 아니냐고 할 만한 놈이 있기는 하지만, 다음과 같은 텍스트 편집기를 대상으로 작업을 하게 됩니다.

마치며

현재까지 예상으로는 편집 능력에서는 거의 최하를 다투는 메모장이 압도적인 1위를 하지 않을까 생각합니다. 이게 단순히 텍스트를 붙여넣고 저장하고, 클립보드로 복사하고, 클립보드에서 붙여넣는 능력이 매우 탁월하다는 사실을 이번에 알게 되었기 때문입니다. 아무튼 기대가 됩니다.

관련 문서

내부 문서

외부 문서

이 글은 스프링노트에서 작성되었습니다.


Posted by koc/SALM 트랙백 0 : 댓글 0

난 판도라 상자를 열었을까?

요즘 저런 생각을 절로 하고 있습니다. 괜히 건드리면 안 될 물건을 건드리지 않았나 후회해 봅니다.

최근 두 개의 글을 올렸습니다. 최근이고 뭐고, 새해 첫날에 옛한글 관련 포스팅을 두 개나 올려 버렸죠.

그런데 갈수록 험난한 길이 보입니다. 오늘은 (X)HTML 코드를 텍스트 편집기에 복사해 붙여넣기를 했다가 그게 엉뚱하게 바뀌는 현상을 경험했습니다. 난감합니다. 이걸 버그 리포팅을 하자니, 특정 프로그램을 너무 때리는 것이 되지 않나 싶고, 버그 리포팅을 안 하자니 그래도 버그인데 안 할 수도 없고…. 더구나 그 편집기에서는 옛한글이 포함된 (X)HTML 문서를 읽어올 경우 경고 없이 허락도 받지 않고 마음대로 바꾸어 버립니다.

벌레가 줄줄이…

그 편집기만의 문제가 아니었습니다. 대부분의 편집기에서 옛한글을 입력하기 힘들다는 현실을 깨닫게 되었습니다. 아니, 진작에 알고 있었지만 지금까지 외면해 왔습니다. 양심이 가슴 한쪽을 쿡쿡 찌르는군요.

죄송합니다, 세종대왕님!

이 모자라고 모자란 후손은 세종어제 훈민정음조차 컴퓨터에 제대로 나타내지 못하고 있습니다.

아무튼 벌레가 줄줄이 나타나고 있습니다. 그래서 아예 옛한글을 잘 나타내는 텍스트 편집기(가칭)라는 글을 준비하고 있습니다. 입력까지는 바라지도 않습니다. 어차피 우리가 쓰는 키보드로는 입력이 불가능합니다. 입력하려면 반드시 특별한 입력 소프트웨어가 필요합니다. 웹에서 입력할 수 있게 해주는 웹사이트가 있는데, 아쉽게도 모질라 파이어폭스나 구글 크롭에서는 동작하지 않습니다. 오직 인터넷 익스플로러에서만 동작합니다. 오호 통재라, 오호 애재라! 그렇습니다. 한글을, 옛한글을 가장 못 나타내는 웹브라우저가 인터넷 익스플로러인데도 옛한글 관련 툴은 인터넷 익스플로러용이 가장 많습니다. 아마 그놈이 가장 못 나타내기 때문에 더 열성적으로 그놈만 지원하는 것일까요?

글꼴은 반드시 필요해!

글꼴이 갖춰져야 위와 같이 볼 수 있습니다.

글꼴이 갖춰져야 위와 같이 볼 수 있습니다.

다음뷰, 옛한글도 한글이란다.라는 글에 나온 내용을 볼 수 없는 사람도 있습니다. 다시 말해 그 글에 나타난 예시에서 맨 윗줄의 내용이 맨 아랫줄의 내용처럼 보일 수도 있습니다. 하지만 다음뷰에 나타난 ??? (물음표 세 개)처럼 보이는 사람은 없으리라 생각합니다. 만약 ???로 보이는 사람이 있다면 웹브라우저를 바꾸는 게 문제가 아니라 당장 운영체제를 바꾸는 게 낫습니다.

옛한글을 보려면 윈도XP 이상의 윈도 운영체제, 맥 OS X 이상, 리눅스 커널 2.4 이상이 필요하지요. 더구나 리눅스의 경우 X윈도의 버전과 거기에 쓰이는 데스크탑(윈도의 Explorer. ←이게 데스크탑을 작동하는 인 동시에 윈도 탐색기입니다.)인 GNOME(그놈) 및 KDE의 버전도 따져 봐야 합니다.

한글 입력과 표현에 대한 자세한 정보는 다음과 같은 사이트에서 구할 수 있습니다. 다만 한양 사용자 정의 영역 코드(Hanyang private use area code; 한양 PUA 코드)는 표준 문제로 도태되고 있습니다. 표준 방식은 한글자모 코드(Jamo-Composed code; 일명 첫가끝 코드)입니다.

제가 윈도를 쓰므로 윈도용 입력기를 소개합니다.

위의 여러 글을 읽으면 글꼴도 소개하고 있지만 여기에서 따로 소개합니다. 참고로 MS에서 배포한 글꼴은 윈도에서만 써야 합니다. 리눅스나 맥 OS에서는 사용하면 안 됩니다. 이것을 어기고 다들 리눅스나 맥 OS X에서 쓰시는데, 라이선스 위반입니다. 특히 문화재청(국가기록유산 홈페이지 등), 디지털 한글박물관, 국립국어원 등에서 배포하는 글꼴은 윈도 전용 라이선스 글꼴로서, 한양 UPA 방식을 따릅니다. 그러므로 해당 사이트를 사용하지 않는다면 그 글꼴을 설치하지 않는 것이 좋습니다.

  • 은 글꼴 :: 다운로드 - 압축을 푼 뒤 %SystemRoot%\Fonts 폴더에 복사하면 됩니다.
  • Microsoft 옛한글 글꼴 (링크 삭제) - 기이하고 신기하고 이상하게도 Microsoft Internet Explorer에서는 옛한글을 제대로 보여주지 못하는 때가 있습니다. 그리고 반드시 윈도에서만 사용해야 라이선스를 가집니다. 이것은 한양 PUA 지원하는 비표준 글꼴입니다. 익스플로러에서 잘 나타내지 못하는 이유도, 처음에는 MS가 사용자 영역(UPA)를 지원했으나 나중에 유니코드 사용자 영역에 대한 공식적인 지원을 하지 않고 있기 때문입니다. 따라서 보이면 다행, 안 보여도 어쩔 수 없습니다.
  • Code 2000 - 셰어웨어 글꼴(유료). 한글이 예쁘지는 않지만, 모든 자소가 포함되어 못 나타내는 글자는 없습니다.

어?! 그래도 안 나오네!

이렇게까지 했는데도 안 나오는 경우가 있다.

USP10.DLL 파일이 문제였다.

이게 뭐냐고? Uniscribe Unicode script processor (줄여서 유니스크라이브(Uniscribe))라는 것인데, 이게 겨우 버전 1밖에 안 되는데도, 빌드넘버에 따라 성능 차이가 심합니다. 참고로 내가 가진 파일의 버전은 1.626.5756.0, 날짜는 2006년 10월 13일이며, 파일 크기는 503296 바이트입니다. 이 파일의 최신 버전은 윈도 7에 포함된 1.626.7600.16385로서, 날짜는 2009년 7월 14일이며, 파일 크기는 612 KiB입니다. 최근 나온 Microsoft® Office 2010 베타버전에는 1.626.7600.16385 버전의 파일이 들어 있는데, 날짜는 2009년 8월 4일이며, 파일 크기는 639824 바이트입니다. 다시 말해 버전은 윈도 7에 포함된 파일과 같으나 날짜와 파일 크기는 다릅니다.

아무튼 이 파일을 복사하여 교체하면 되는데, 작업이 좀 복잡합니다. 그래서 그런지 MS오피스 2010 베타버전도 설치 과정에서 시스템 폴더를 쓰지 않고 자신의 공유 폴더에 넣어 두고 있습니다.

이렇게 고생고생해서 겨우 옛한글을 보게 되었습니다. 저는 판도라 상자를 열었을까요? 그 판도라 상자는 희망의 판도라 상자일까요? 절망의 판도라 상자일까요?

남은 이야기

그리고 제 블로그는 읽기가 좀 불편함을 알게 되었습니다.

한글이나 한자는 1글자, 영문이나 숫자는 0.5글자로 계산한다는 가정하고, 보통 한 줄에 글자는 25자 정도 되어야 읽기 좋습니다. 그보다 적으면 읽기는 편할 수 있으나 빨리 지루해진다고 하며, 그보다 많으면 너무 행이 길어서 빨리 지친다고 합니다. 그런데 제 블로그는 무려 50글자를 넘겼습니다. 무려 두 배나 많습니다.

물론 지금도 제 블로그의 글꼴 크기는 꽤 큰 편입니다. 그런데도 글자가 많은 것은 본문의 폭이 720 픽셀이기 때문입니다.

그래서 글꼴 크기가 작으면 글자가 뭉개져서 보기 흉해지는 옛한글 문제도 생기고 해서 겸사겸사 글자 크기를 좀 더 크게 하기로 했습니다. 어차피 제 자신이 보려고 블로그에 글을 올리고 있으니, 눈 나쁜 저에게는 더 좋은 일이지요.

그리고 바꾸는 김에 지금까지 미뤄 왔던 CSS 글꼴 설정도 손을 보았습니다. 글꼴 적용 순서는 은 돋움, 은 자모 돋움, 은 바탕, 은 자모 바탕, 돋움, 돋움 옛한글, 굴림 옛한글, Code2002, Code2001, Code2000의 순서입니다.

그리고 위의 은 글꼴을 받아서 설치하고 나서도 제 블로그의 글자가 이상하게 보인다면 댓글 남겨 주십시오.

마지막으로 스크린샷 몇 개!

글꼴이 달라지기는 했지만, 옛 한글은 잘 나옵니다.

글꼴이 달라지기는 했지만, 옛 한글은 잘 나옵니다.




참고 자료

내부 자료

외부 자료

이 글은 스프링노트에서 작성되었습니다.


Posted by koc/SALM 트랙백 0 : 댓글 0

티스토리 툴바