教育行業(yè)A股IPO第一股(股票代碼 003032)

全國咨詢/投訴熱線:400-618-4000

c/c++培訓之GB2312字符串和UTF-8之間的轉換

更新時間:2016年08月01日09時43分 來源:傳智播客C/C++學科 瀏覽次數(shù):

 在編程過程中需要對字符串進行不同的轉換,特別是Gb2312和Utf-8直接的轉換。在幾個開源的魔獸私服中,很多都是國外開發(fā)的,而暴雪為了能夠兼容世界上的各個字符集也使用了UTF-8。在中國使用VS(VS2005以上版本)開發(fā)基本都是使用Gb2312的Unicode字符集,所以當在編程過程中就需要進行字符轉換,這樣才能兼容游戲,否則就是亂碼。而在控制臺顯示字符串時,正好相反需要將UTF-8的字符串轉換成Gb2312才能正常顯示。
 為了解決這個問題,轉換如下;其實很多地方都可以使用到字符串的編碼轉換,代碼如下:
 
//UTF-8到GB2312的轉換  
char* U2G(const char* utf8)  
{  
int len = MultiByteToWideChar(CP_UTF8, 0, utf8, -1, NULL, 0);  
wchar_t* wstr = new wchar_t[len+1];  
memset(wstr, 0, len+1);  
MultiByteToWideChar(CP_UTF8, 0, utf8, -1, wstr, len);  
len = WideCharToMultiByte(CP_ACP, 0, wstr, -1, NULL, 0, NULL,   NULL);  
char* str = new char[len+1];  
memset(str, 0, len+1);  
WideCharToMultiByte(CP_ACP, 0, wstr, -1, str, len, NULL, NULL);  
if(wstr) delete[] wstr;  
return str;  
}  
 
//GB2312到UTF-8的轉換  
char* G2U(const char* gb2312)  
{  
int len = MultiByteToWideChar(CP_ACP, 0, gb2312, -1, NULL, 0);  
wchar_t* wstr = new wchar_t[len+1];  
memset(wstr, 0, len+1);  
MultiByteToWideChar(CP_ACP, 0, gb2312, -1, wstr, len);  
len = WideCharToMultiByte(CP_UTF8, 0, wstr, -1, NULL, 0, NULL,  NULL);  
char* str = new char[len+1];  
memset(str, 0, len+1);  
WideCharToMultiByte(CP_UTF8, 0, wstr, -1, str, len, NULL, NULL);  
if(wstr) delete[] wstr;  
return str;  
}  
 
 無論是GB2312到UTF-8的轉換,還是UTF-8到GB2312的轉換,都需要注意的是在使用字符串后,需要刪除字符串指針;這是因為以上兩個方法返回的是字符串指針,如果沒有刪除將會內存泄漏,可別說我沒提醒你哦。

 本文版權歸傳智播客C++培訓學院所有,歡迎轉載,轉載請注明作者出處。謝謝!
作者:傳智播客C/C++培訓學院
首發(fā):http://metathetuscanyresort.com/c/ 
0 分享到:
和我們在線交談!