UTF-8到GBK轉換

實際就是由寬字節轉換爲多字節的過程

-------------

首先MultiByteToWideChar(CP_UTF8, 0, (LPCSTR)szOut, -1, (LPWSTR)wszGBK, len) 轉換UTF-8 到表中UNICODE

然後

WideCharToMultiByte(CP_ACP, 0, (LPWSTR)wszGBK, -1, szGBK, len, NULL, NULL); UNICODE轉換爲標準多字節

這個時候已經是ANSI格式了,其實不是GBK格式,但是一般這個時候編譯器和操作系統字符集就能去解決下邊的事了,就是說可以直接當普通的char *來用了

---------------

void UTF8ToGBK( char *&szOut )
{
  unsigned short *wszGBK;
  char *szGBK;
  //長度
  int len = MultiByteToWideChar(CP_UTF8, 0, (LPCSTR)szOut, -1, NULL, 0);
  wszGBK = new unsigned short[len+1];
  memset(wszGBK, 0, len * 2 + 2);
  MultiByteToWideChar(CP_UTF8, 0, (LPCSTR)szOut, -1, (LPWSTR)wszGBK, len);


  //長度
  len = WideCharToMultiByte(CP_ACP, 0, (LPWSTR)wszGBK, -1, NULL, 0, NULL, NULL);
  szGBK = new char[len+1];
  memset(szGBK, 0, len + 1);
  WideCharToMultiByte(CP_ACP, 0, (LPWSTR)wszGBK, -1, szGBK, len, NULL, NULL);


  //szOut = szGBK; //這樣得到的szOut不正確,因爲此句意義是將szGBK的首地址賦給szOut,當delete []szGBK執行後szGBK的內


  //存空間將被釋放,此時將得不到szOut的內容


  memset(szOut,'0',strlen(szGBK)+1); //改將szGBK的內容賦給szOut ,這樣即使szGBK被釋放也能得到正確的值
  memcpy(szOut,szGBK,strlen(szGBK)+1);//最後這個+1不要忘了




  delete []szGBK;
  delete []wszGBK;
}

發佈了29 篇原創文章 · 獲贊 2 · 訪問量 4萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章