Jump to...
redirecting...

Log for Ubuntu 台灣社群

iconv -f GBK -t UTF-8 "$file" -o "$utf8_file"
這條指令有什麼問題嗎?怎麼感覺不成功,輸出的還是gbk編碼
不確定,改用 piconv 看看?
iconv -l 也可以看一下有沒有 GBK & UTF-8 這兩個,我這邊的 22.04 看是有的,但不確定你機器上的如何。
chatgpt給出的程式碼,我想把gbk的文件批次轉換成utf-8,因為gbk格式太噁心,我找下piconv指令
我看了是有的
[photo](media:AgACAgQAAx0CPRn5XQABAecPZvYW1tDZMtGTZ2-kdhDkfX4w5IcAApfBMRtRDrBT0ZvLElQERWsBAAMCAANzAAM2BA@telegram)
單獨把檔案拿出來試試把,煩透了gbk
Hi
……
發現問題了,chatgpt把輸入輸出搞反了。。。
改好了,直接判斷是不是utf8編碼,不是就轉換,不然各種奇葩編碼都出來了編碼為 unknown-8bit】
中文編碼真噁心
繁體中文編碼有什麼格式,我也做下適配,剛又發現還有utf-16的格式,太罕見了,各種報錯
常見的就 Big-5 跟 UTF-8吧
bug8
WTF8
UTF-16 不罕見,這是 Windows 內部使用的編碼
好像還有一個香港的,剛iconv -l看了下big5種類好多,直接放棄,一般也就gbk編碼容易出現問題
應該有程式庫/工具可以自動偵測字元編碼類型
但我主要目的是直接轉換utf8,這樣不會出錯,所以需要做if else判斷
icu
[photo](media:AgACAgQAAx0CPRn5XQABAecgZvYtNsuBTtdoGwK5PQABPEqZOJBDAAIcwDEbELi5U3WmEy6_bhRDAQADAgADcwADNgQ@telegram)