用C語言寫UTF-8編碼的文件

原創

OneProg

2019-02-22 14:20

轉自http://blog.csdn.net/zaffix/article/details/7217701

爲實現用C語言寫UTF-8編碼的文件，測試了以下兩種情況。

第一種情況，爲fopen指定一個編碼，然後寫入wchar_t字符串，最終寫入的文件就是UTF-8編碼的了，原理不清楚，估計是fwrite時對wchar_t做了編碼轉換（如果寫入char的話就會亂碼）。

[cpp]viewplain copy print ?

#include<stdio.h>
#include<tchar.h>
intmain()
{
FILE*fp=fopen("test.txt","wt+,ccs=UTF-8");
wchar_t*s=_T("hello,你好！");
fwrite(s,sizeof(wchar_t),wcslen(s),fp);
fclose(fp);
return0;
}

#include <stdio.h>
#include <tchar.h>

int main()
{
	FILE* fp = fopen("test.txt", "wt+,ccs=UTF-8");

	wchar_t* s = _T("hello, 你好！");

	fwrite(s, sizeof(wchar_t), wcslen(s), fp);

	fclose(fp);

	return 0;
}

第二種情況，先將字符串編碼轉換爲UTF-8格式的，然後再寫入。

[cpp]viewplain copy print ?

#include<stdio.h>
#include<string.h>
#include<Windows.h>
intmain()
{
FILE*fp=fopen("test.txt","wb+");
//寫入UTF-8的BOM文件頭
charheader[3]={(char)0xEF,(char)0xBB,(char)0xBF};
fwrite(header,sizeof(char),3,fp);
char*s="hello,你好！";
wchar_twc[256];
//將ANSI編碼的多字節字符串轉換成寬字符字符串
intn=MultiByteToWideChar(CP_ACP,0,s,strlen(s),wc,256);
if(n>0)
{
wc[n]=0;
charmb[1024];
//將寬字符字符串轉換成UTF-8編碼的多字節字符串
n=WideCharToMultiByte(CP_UTF8,0,wc,wcslen(wc),mb,1024,NULL,NULL);
if(n>0)
{
mb[n]=0;
fwrite(mb,sizeof(char),strlen(mb),fp);
}
}
fclose(fp);
return0;
}

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

用C語言寫UTF-8編碼的文件

如何在低代碼平臺中引用 JavaScript ？

探究職業發展的關鍵：能力模型解讀

高效率使用windows

如何使用 JavaScript 獲取當前頁面幀率 FPS

工程款拖欠，農民工怎麼了？就得一直忍着委屈求全嗎？

HarmonyOS 實現下拉刷新，上拉加載更多

語音信號處理中的“窗函數”

智能決策新時代：可視化大屏是否能夠超越傳統白板？

解密Prompt系列28. LLM Agent之金融領域摸索：FinMem & FinAgent

分享幾個.NET開源的AI和LLM相關項目框架

shell，exec，source執行腳本的區別

shell 判斷文件夾或文件是否存在

linux中合併多個文件內容到一個文件的例子

開博第一篇，推薦一本書

VC++ Tab Control控件的詳細使用(圖)

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結