概要

マルチコアやハイパースレッド(HT)のCPUでシングルスレッドのプログラムを実行すると基本的には各CPUへ均等に割り当てられます。
実行CPUを固定すると、キャッシュやTLB等が有効に使われ実行速度の向上が期待できます。
本プログラムは論理CPUの数のスレッドを作成し、そのスレッドを各論理CPUに固定して約10秒実行します。

テスト環境

コンパイラ

Visual C++ 2008/2013 Express 32/64bit マルチバイト/UNICODE

実行環境

Windows XP Professional Service Pack 3 32bit(VirtualBox)
Windows 7 Enterprise Service Pack 1 64bit(Sandy Bridge-E)
Windows 8.1 Enterprise 64bit(Arrandale)

プログラムソースの概要

WinMain

GetCPUMax関数により論理CPUの個数を取得します。
CreateThread APIにより各スレッドを作成し実行します。
SetThreadAffinityMask APIの第2引数でどのCPUに割り当てるかを指定します。
ビット0がCPU0、ビット1がCPU1といったぐらいにビットごとにCPU番号が決まっており、該当ビットを1にするとそのCPUに割り当てられます。
この例では、1<<1としておりこれは1を1回左へシフトしますので、2となり1ビット目が1となります。
以下に第2引数の例を示します。
0x3 // CPU0 CPU1に割り当て
0x80 // CPU7に割り当て
0xff // CPU0~CPU7に割り当て
1<<7 // CPU7に割り当て
なお、SetThreadAffinityMask APIの第2引数は64bitなので64個以上のCPUは指定することができません。
Sleep APIにより10秒待機します。
end_f変数を1にセットし、スレッドに終了指示を与えます。
WaitForSingleObject APIにより各スレッドが終了するまで待機します。
CloseHandle APIによりスレッド作成時に作成されたスタック等のデーターを解放します。

hi_load

コンパイラの最適化によりループが削られないように終了指示用の変数はvolatile属性を付加しています。
end_fが0以外の値の時、スレッドを終了します。

GetCpuMax

GetSystemInfo APIにより論理CPUの個数を取得します。
例えば、Core i7-3820の場合、4コアでHT対応なので、論理CPU数は8個となります。

ソースコード

//	全CPUの使用率を100%にする

#include <windows.h>


//	論理CPU数を取得する

int GetCPUMax(void){
	SYSTEM_INFO sys;
	GetSystemInfo(&sys);
	return sys.dwNumberOfProcessors;
}

volatile int end_f = 0;	//	スレッドを終了させるときに0以外に設定

//	重負荷のスレッド

DWORD WINAPI  high_load(LPVOID lp){
	while (end_f == 0);
	return 0;
}


int WINAPI WinMain(HINSTANCE hCurInst, HINSTANCE hPrevInst, LPSTR lpsCmdLine, int nCmdShow){
	HANDLE* h;
	DWORD* id;
	int n;
	int cpuMax = GetCPUMax();

	h = new HANDLE[cpuMax];
	id = new DWORD[cpuMax];

	for ( n = 0; n < cpuMax; n++){
		h[n] = CreateThread(0, 0, &high_load, 0, 0, &id[n]);	//	スレッドを作成
		SetThreadAffinityMask(h[n], 1 << n);	//	CPUを固定
	}
	Sleep(10000);
	end_f = 1;
	for (n = 0; n < cpuMax; n++){
		WaitForSingleObject(h[n], INFINITE); /* スレッド終了を待つ */
		CloseHandle(h[n]);
	}
	delete [] h;
	delete [] id;
	return 0;
}

実行ファイルとソースファイルのダウンロード