EasyCVR的AI智能分析版本在做研发的时候,就受到了很多朋友的关注,EasyCVR的人脸识别功能采用了Go语言,使用c/c++ 的头文件和dll文件。在C++ 中如果出现中文,会出现乱码的问题,使用notepad++打开保存的二进制文件,出现乱码。
正常的情况选择UTF8编码正常显示:
在计算机的内部,所有的数据都是以二进制的形式保存的,在存储文本时,需要将文本文件的信息都转换为二进制进行保存,而现实是将二进制转换为文本显示,所以编码就是以二进制和显示字符直接转换。
多字节到宽字节的转换:
setlocale(LC_ALL, ""); size_t requiredSize = mbstowcs(nullptr, w, 0); wszClassName = new WCHAR[requiredSize + 1]; memset(wszClassName, 0x00, sizeof(wszClassName)); if (static_cast<size_t>(-1) == mbstowcs(wszClassName, w, requiredSize + 1)) { std::cout << "fail" << std::endl; return -1; } else { std::wcout << "success: " << wszClassName << std::endl; } return 0; 复制代码
UTF-8编码转GBK,在vs中打印输出:
std::wstring UT2WC(const char* buf) { int len = MultiByteToWideChar(CP_UTF8, 0, buf, -1, NULL, 0); std::vector<wchar_t> unicode(len); MultiByteToWideChar(CP_UTF8, 0, buf, -1, &unicode[0], len); return std::wstring(&unicode[0]); } std::string ws2s(const std::wstring& ws) { std::string curLocale = setlocale(LC_ALL, NULL); setlocale(LC_ALL, "chs"); const wchar_t* _Source = ws.c_str(); size_t _Dsize = 2 * ws.size() + 1; char *_Dest = new char[_Dsize]; memset(_Dest, 0, _Dsize); wcstombs(_Dest, _Source, _Dsize); std::string result = _Dest; delete[]_Dest; setlocale(LC_ALL, curLocale.c_str()); return result; } 复制代码
Unicode、ANSI和UTF之间的转换:
std::string UnicodeToUTF8(const std::wstring & wstr) { std::string ret; try { std::wstring_convert< std::codecvt_utf8<wchar_t> > wcv; ret = wcv.to_bytes(wstr); } catch (const std::exception & e) { std::cerr << e.what() << std::endl; } return ret; } std::wstring UTF8ToUnicode(const std::string & str) { std::wstring ret; try { std::wstring_convert< std::codecvt_utf8<wchar_t> > wcv; ret = wcv.from_bytes(str); } catch (const std::exception & e) { std::cerr << e.what() << std::endl; } return ret; } std::string UnicodeToANSI(const std::wstring & wstr) { std::string ret; std::mbstate_t state = {}; const wchar_t *src = wstr.data(); size_t len = std::wcsrtombs(nullptr, &src, 0, &state); if (static_cast<size_t>(-1) != len) { std::unique_ptr< char[] > buff(new char[len + 1]); len = std::wcsrtombs(buff.get(), &src, len, &state); if (static_cast<size_t>(-1) != len) { ret.assign(buff.get(), len); } } return ret; } std::wstring ANSIToUnicode(const std::string & str) { std::wstring ret; std::mbstate_t state = {}; const char *src = str.data(); size_t len = std::mbsrtowcs(nullptr, &src, 0, &state); if (static_cast<size_t>(-1) != len) { std::unique_ptr< wchar_t[] > buff(new wchar_t[len + 1]); len = std::mbsrtowcs(buff.get(), &src, len, &state); if (static_cast<size_t>(-1) != len) { ret.assign(buff.get(), len); } } return ret; }