鈴木メモ

Illustratorの練習メモとか、最近はフォントを作ったり。

*

Illustratorにコピペすると文字化けするIBM拡張文字 その2

    Illustrator, フォント, 漢字

以前にIllustratorにコピペすると文字化けするIBM拡張文字と言う記事を書きましたが、久しぶりに他からIllustratorに文字を持ち込もうとしたら、テキストファイル(.txt)の読み込みが出来なくなっていました。
いつかのアップデートで変わってたのかもしれない。直接コピペ出来るようになったわけでもなく、相変わらずIBM拡張漢字が異体字に文字化けします。

Adobeの公式ヘルプhelpx.adobe:テキストの読み込みと書き出し(最終更新日 : 2023年5月24日)はテキストファイル(.txt)の読み込みが出来るとのことですが、最近テキスト周りは変わったような情報も出ていたし情報が古いのかもしれない。

たまにしか使わないとはいえ、ちょっと困るので他のやり方が出来ないか考えてみました。
この記事はWindows11、Illustrator(30.1)で書いています。

ちなみに前回記事では以下の方法を紹介していました。
・やり方その1:コピペを使わず、.txtをIllustratorの「テキスト読み込みオプション」で開ける→(出来なくなってる)
・やり方その2:異体字切り替えを使って1文字ずつ指定し直す

やり方その3:コピペを使わず、Googleドキュメントで.pdfにしてダウンロード、Illustratorに「配置」

文字化けさせないで外からIllustratorに文字列を持っていく別の方法を試したので紹介します。
あいかわらず、IBM拡張文字はIllustratorに直接コピペをしてはいけません。一部が異体字に化けてしまいます。
今回は手間がかかりますが①テキストをGoogleドキュメントでPDFにしてダウンロード→②Illustratorで「配置」→③分割された文字を連結しなおす。(改行の消滅とサロゲート文字のアウトライン化はあきらめる)で出来ました。

●インターネットのブラウザから下の文字列をコピーします。テスト用文字列は好きな方を使って下さい。
【テスト用文字列-その1】
正しいもの:塚晴朗凞猪益礼神祥福靖精羽蘒諸逸都隆飯飼館鶴
化けたもの:塚晴朗凞猪益礼神祥福靖精羽蘒諸逸都隆飯飼館鶴
【テスト用文字列-その2】
ⅰⅱⅲⅳⅴⅵⅶⅷⅸⅹⅠⅡⅢⅣⅤⅥ
ⅦⅧⅨⅩ¬¦'"㈱№℡∵纊褜鍈銈
蓜俉炻昱棈鋹曻彅丨仡仼伀伃伹佖侒
侊侚侔俍偀倢俿倞偆偰偂傔僴僘兊
兤冝冾凬刕劜劦勀勛匀匇匤卲厓厲叝
﨎咜咊咩哿喆坙坥垬埈埇﨏塚增墲夋
奓奛奝奣妤妺孖寀甯寘寬尞岦岺峵崧
嵓﨑嵂嵭嶸嶹巐弡弴彧德忞恝悅悊惞
惕愠惲愑愷愰憘戓抦揵摠撝擎敎昀昕
昻昉昮昞昤晥晗晙晴晳暙暠暲暿曺朎
朗杦枻桒柀栁桄棏﨓楨﨔榘槢樰橫橆
橳橾櫢櫤毖氿汜沆汯泚洄涇浯
涖涬淏淸淲淼渹湜渧渼溿澈澵濵瀅瀇
瀨炅炫焏焄煜煆煇凞燁燾犱犾猤猪獷
玽珉珖珣珒琇珵琦琪琩琮瑢璉璟甁畯
皂皜皞皛皦益睆劯砡硎硤硺礰礼神
祥禔福禛竑竧靖竫箞精絈絜綷綠緖繒
罇羡羽茁荢荿菇菶葈蒴蕓蕙蕫﨟薰蘒
﨡蠇裵訒訷詹誧誾諟諸諶譓譿賰賴贒
赶﨣軏﨤逸遧郞都鄕鄧釚釗釞釭釮釤
釥鈆鈐鈊鈺鉀鈼鉎鉙鉑鈹鉧銧鉷鉸鋧
鋗鋙鋐﨧鋕鋠鋓錥錡鋻﨨錞鋿錝錂鍰
鍗鎤鏆鏞鏸鐱鑅鑈閒隆﨩隝隯霳霻靃
靍靏靑靕顗顥飯飼餧館馞驎髙
髜魵魲鮏鮱鮻鰀鵰鵫鶴鸙黑

https://docs.google.com/document/からGoogleドキュメントにアクセスします。(WEBブラウザで動きます。Googleアカウントが必要。無料。)(PDF文書ファイルが出来ればいいのでWordでも出来るかもしれません。)
「+」をクリックして新規ファイルを作成、テキストをペーストします。

●「ファイル」-「ダウンロード」-「PDFドキュメント(.pdf)」。パソコンのダウンロードフォルダに入ってきます。

●Illustratorで何かファイルを開け、先程のPDFファイルをドラッグ&ドロップします。(またはIllustratorで上の「ファイル」-「配置」でもOK。)

●PDFファイルを選択し、「埋め込み」ボタンを押します。もし「このドキュメントには再解釈されたPDFオブジェクトが含まれています」が出た場合はOKで閉じる。(テストPDFに第三水準のテスト文字も入れているためこれが出てます。)

●PDFの不要な四角枠を削除して中身だけにします。①グループ解除、クリッピングマスク解除。または②ダイレクト選択ツール(白矢印)で不要な枠をクリックし「選択」-「共通」-「塗りと線」でまとめて削除。どっちでも良いです。

●Illustrator上で文字が維持できていることを確認します。文字は化けてませんが、テキストの下線がぶつぶつ切れています。

●テキストが1文字ずつ分割されてしまったのを直します。dtp-transit:複数のテキストを、ひとつのテキストオブジェクトにするにはを参考にさせてもらいました。

①連結したい文字群をまとめて選択し、コピー(パソコンに記憶させる)。

②四角ツールでそばに同じくらいの大きさの四角オブジェクトを描いて、テキストツールに持ち替え、四角オブジェクトの左上の辺のパスをクリック。さっきの文字群をペースト。四角の中に中身が連結されて入ってきます。

③改行は無視されるので、段落ごとにコピーを繰り返しすると多少見やすいかも?(改行保持での連結は有料のイラレスクリプトを探して下さい。)

●一度Illustratorで化けていない状態にできたら、Illustratorの他のファイルにコピペしても大丈夫です。
●このやり方は文字列中に「IBM拡張文字を含むかどうか分からない」・「IBM拡張文字が複数回出てくる」時に便利です。

注)第三水準以降のサロゲートペア文字はアウトライン化されます

PDF配置で持ち込むと、第一水準/第二水準/IBM拡張文字まではOKですが、第三水準以降のサロゲートペア文字(Unicodeが5桁のもの)は埋め込み時に「このドキュメントには再解釈されたPDFオブジェクトが含まれています」が出た後、部分的にアウトライン化されてしまいます。アウトライン化されたオブジェクトは連結動作で消えますので注意。

【テスト用文字列-常用漢字と人名用漢字
《常用漢字の第2水準》(30字)
曖彙鬱楷諧毀嗅惧憬錮傲刹恣摯羞箋踪緻嘲貪丼訃璧哺喩瘍拉辣慄籠
《常用漢字の第3水準》(4字)
𠮟塡剝頰
《人名用漢字の第2水準》(192字)
侑俐凜凛凰勁堯奎崚巖巫已彗徠惺昊昴晏晄晟晨暉檜栞梛椰槇橙櫂毬洸洵渾滉漱澪煌熙燎燿珈珀琥瑶皓眸祿稟穰穹笙絆綺綸羚翔脩苺茉莉菫萠蕾詢諄赳迪逞遙釉頌颯驍麒黎亞惡爲榮衞圓應櫻奧價壞懷樂卷陷氣僞戲峽狹曉勳惠鷄藝縣儉劍險圈檢顯驗嚴廣恆國碎雜兒濕實壽收從澁獸縱敍將燒奬條乘淨剩疊孃讓釀眞寢愼盡粹醉穗齊靜攝專戰纖禪壯爭莊搜裝騷藏臟帶滯單團彈晝鑄廳聽鎭轉傳盜稻拜賣髮拔祕拂佛飜萬默彌藥與搖樣謠來覽凉壘禮
《人名用漢字の第3水準》(105字)
俠俱吞摑渚焰猪琢祐禱禎簞繫繡萊蔣蟬蠟醬顚鷗逸謁緣橫溫禍悔海渴寬漢祈器虛響勤謹薰揭擊黃黑穀祉視社者煮臭祝暑署緖諸祥涉狀神瀨節祖巢僧層瘦增憎贈卽嘆著徵懲都德突難梅繁晚卑碑賓敏侮福勉步墨每賴欄虜綠淚類曆歷練鍊郞朗廊錄

【テスト用文字列-サロゲートペア文字
𠮟る(しかる)、𩸽定食(ほっけていしょく)、 𠮷野家(よしのや/※つちよし)、𠀋一郎(じょういちろう/※点ありの丈)