• 使用 DFS 轻松求解数独难题(C++ 的一个简单实现)


    起因

    都说懒惰是第一生产力,最近在玩数独游戏的时候,总会遇到拆解数独比较复杂的情况,就想着自己写个代码解题,解放双手。所以很快就写了一个简单的代码求解经典数独。拿来跑了几个最高难度的数独发现确实很爽!虽说是比较暴力的 DFS,但是由于数独中约束较多的性质,实际上要找出唯一解并不复杂,即使是最高难度的数独也可以在 0.04s 内解完,可以说是非常的方便。

    思路

    经典数独游戏由 9*9 的方格组成,每个方格可填 1~9 的数字,一般都有三种约束:同行,同列,同宫不可出现相同的数字。只要暴力时利用这些约束,就可以快速剪枝。

    考虑最简单的情况:我们对于任何一个空位,可以尝试去填 1~9 的数字,并且检查三种约束是否满足。若满足,就继续填下一个空位。

    处理约束

    实际上,并不需要每个格子都去把 1~9 全部尝试。因为填的数字越多,约束就越强,我们就越容易发现之前填数时的错误。所以我们可以预先处理三种约束影响的格子范围:

    void initializeRelation() {
    	memset(digitsUsed, 0, sizeof digitsUsed);
    	// sub-grids
    	for (int i = 0; i < 3; i++) {
    		for (int j = 0; j < 3; j++) {
    			int num = i * 3 + j;
    			for (int k = 0; k < 3; k++) {
    				for (int l = 0; l < 3; l++) {
    					int idx = calcIdx(i * 3 + k, j * 3 + l);
    					group[2][idx] = num;
    					r[num].push_back(idx);
    				}
    			}
    		}
    	}
    	// rows
    	for (int i = 0; i < N; i++) {
    		for (int j = 0; j < N; j++) {
    			int idx = calcIdx(i, j);
    			group[0][idx] = i + N;
    			r[i + N].push_back(idx);
    		}
    	}
    	// columns
    	for (int i = 0; i < N; i++) {
    		for (int j = 0; j < N; j++) {
    			int idx = calcIdx(j, i);
    			group[1][idx] = i + N * 2;
    			r[i + N * 2].push_back(idx);
    		}
    	}
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32

    预先处理完约束后,下次要找一个格子到底应该对应哪些约束时,就可以直接找到对应的 idx 序号了。

    状态压缩

    一个格子可以填 1~9 共九种数字,那么到底哪些是可以填的呢?就如同我们实际解数独时一样,我们可以在格子上标记一下有哪些数字是符合约束的。一个简单的方法是把这个状态压缩成二进制数,每个可用数字代表一个二进制位的 1,若不可用,则该位为 0。那么一个格子上的可用数字可用一个 9 位二进制数表示,范围是0~2^9,也即一个格子至多只有 512 种状态。

    接下来 gcc 有一些方便的内建函数可以帮到我们,它们都是以 __builtin 开头:

    • __builtin_popcount(unsigned int x) 返回无符号整型x的二进制中 1 的个数
    • __builtin_ctz(unsigned int x)返回无符号整型x的二进制的末尾有多少个 0

    上述函数也可使用 std::bitset::count 等实现,作用类似。

    现在计算某个格子还有多少可用数字就可以这样:

    inline int calcUsable(int idx) {
    	return 9 - __builtin_popcount(digitsUsed[idx]);
    }
    
    • 1
    • 2
    • 3

    DFS

    当我们枚举数字时,其实就是从当前状态中找到下一个可用数字,并根据约束关系删除与其相关的格子中的可用数字。

    那么搜索时如何快速判断当前填的数字否可行呢?一个简单的思路是每次找到可用数字最少的格子,这样的格子可以确定更多的约束,搜索空间也更少,一旦失败了,我们可以迅速回滚。

    那么把所有的空格子按照他们的[可用数字个数,可用数字状态]作为一个数对,我们就可以利用std::set构造出一个暴力 DFS 方案:

    bool dfs() {
    	if (grid.empty()) {
    		return true;
    	}
    	pair<int, int> p = *grid.begin();
    	grid.erase(p);
    	int idx = p.second;
    	int digitBit = MASK & ~digitsUsed[idx];
    
    	for (int nextDigitBit = digitBit; nextDigitBit; nextDigitBit ^= lowbit(nextDigitBit)) {
    		int digit = lowbit0Count(nextDigitBit);
    		int currentDigitBit = 1 << digit;
    		g[idx] = digit + 1;
    		vector<int> last;
    		for (int j = 0; j < 3; j++) {
    			for (auto & x: r[group[j][idx]]) {
    				auto it = grid.find(make_pair(calcUsable(x), x));
    				if (it != grid.end() && (digitsUsed[x] | currentDigitBit) != digitsUsed[x]) {
    					grid.erase(it);
    					digitsUsed[x] = digitsUsed[x] | currentDigitBit;
    					grid.insert(make_pair(calcUsable(x), x));
    					last.push_back(x);
    				}
    			}
    		}
    		if (dfs()) {
    			return true;
    		}
    		for (auto &x: last) {
    			grid.erase(make_pair(calcUsable(x), x));
    			digitsUsed[x] = digitsUsed[x] & ~currentDigitBit;
    			grid.insert(make_pair(calcUsable(x), x));
    		}
    	}
    	grid.insert(p);
    	return false;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37

    结语

    由于只考虑经典数独,代码还是非常简洁而且高效的。而对于各种各样的变形数独,也可以考虑根据这种简化约束的方式去暴力求解。如果想要模仿人类解法,对强弱链等逻辑进行推演而非简单暴力的话,还需要更多的工作。

    当然,数独如果由机器暴力计算就会缺失很多乐趣,但去寻找现有问题的一种代码实现也同样是另一种乐趣。我觉得能在数学游戏中找到自己喜欢的部分,并发掘出其中的趣味,其本身也是一种快乐的事情。

    附录

    最终代码如下,输入重定向于sudoku.in,输入格式中星号*代表空位,可在代码最后注释中看到样例。
    输出格式为先输出整体的解,再输出只包含原数独中空位的解。

    #include 
    
    using namespace std;
    
    const int N = 9;
    const int R_NUM = 27;
    const int GRID_NUM = 81;
    const int MASK = (1 << N) - 1;
    
    char str[10][100];
    int s[9][9];
    int g[GRID_NUM];
    int group[3][GRID_NUM]; // groups
    vector<int> r[R_NUM]; // relations
    set<pair<int, int>> grid;
    int digitsUsed[GRID_NUM];
    
    /**
    group 0:
    000000000
    111111111
    222222222
    333333333
    444444444
    555555555
    666666666
    777777777
    888888888
    
    group 1:
    012345678
    012345678
    012345678
    012345678
    012345678
    012345678
    012345678
    012345678
    012345678
    
    group 2:
    000111222
    000111222
    000111222
    333444555
    333444555
    333444555
    666777888
    666777888
    666777888
    **/
    
    inline int calcX(int idx) {
    	return group[0][idx];
    }
    
    inline int calcIdx(int x, int y) {
    	return x * N + y;
    }
    
    inline int lowbit(int x) {
    	return x & (-x);
    }
    
    inline int lowbit0Count(int x) {
    	return __builtin_ctz(x);
    }
    
    inline int calcUsable(int idx) {
    	return 9 - __builtin_popcount(digitsUsed[idx]);
    }
    
    void initializeRelation() {
    	memset(digitsUsed, 0, sizeof digitsUsed);
    	// sub-grids
    	for (int i = 0; i < 3; i++) {
    		for (int j = 0; j < 3; j++) {
    			int num = i * 3 + j;
    			for (int k = 0; k < 3; k++) {
    				for (int l = 0; l < 3; l++) {
    					int idx = calcIdx(i * 3 + k, j * 3 + l);
    					group[2][idx] = num;
    					r[num].push_back(idx);
    				}
    			}
    		}
    	}
    	// rows
    	for (int i = 0; i < N; i++) {
    		for (int j = 0; j < N; j++) {
    			int idx = calcIdx(i, j);
    			group[0][idx] = i + N;
    			r[i + N].push_back(idx);
    		}
    	}
    	// columns
    	for (int i = 0; i < N; i++) {
    		for (int j = 0; j < N; j++) {
    			int idx = calcIdx(j, i);
    			group[1][idx] = i + N * 2;
    			r[i + N * 2].push_back(idx);
    		}
    	}
    }
    
    void fail() {
    	printf("IMPOSSIBLE\n");
    	exit(0);
    }
    
    void printResult() {
    	printf("Result:\n");
    	for (int i = 0; i < N; i++) {
    		for (int j = 0; j < N; j++) {
    			printf("%d", g[calcIdx(i, j)]);
    		}
    		printf("\n");
    	}
    }
    
    void printFillableResult() {
    	printf("\nFillable Result:\n");
    	for (int i = 0; i < N; i++) {
    		for (int j = 0; j < N; j++) {
    			printf("%c", (s[i][j] == 0) ? g[calcIdx(i, j)] + '0' : '*');
    		}
    		printf("\n");
    	}
    }
    
    bool dfs() {
    	if (grid.empty()) {
    		return true;
    	}
    	pair<int, int> p = *grid.begin();
    	grid.erase(p);
    	int idx = p.second;
    	int digitBit = MASK & ~digitsUsed[idx];
    
    	for (int nextDigitBit = digitBit; nextDigitBit; nextDigitBit ^= lowbit(nextDigitBit)) {
    		int digit = lowbit0Count(nextDigitBit);
    		int currentDigitBit = 1 << digit;
    		g[idx] = digit + 1;
    		vector<int> last;
    		for (int j = 0; j < 3; j++) {
    			for (auto & x: r[group[j][idx]]) {
    				auto it = grid.find(make_pair(calcUsable(x), x));
    				if (it != grid.end() && (digitsUsed[x] | currentDigitBit) != digitsUsed[x]) {
    					grid.erase(it);
    					digitsUsed[x] = digitsUsed[x] | currentDigitBit;
    					grid.insert(make_pair(calcUsable(x), x));
    					last.push_back(x);
    				}
    			}
    		}
    		if (dfs()) {
    			return true;
    		}
    		for (auto &x: last) {
    			grid.erase(make_pair(calcUsable(x), x));
    			digitsUsed[x] = digitsUsed[x] & ~currentDigitBit;
    			grid.insert(make_pair(calcUsable(x), x));
    		}
    	}
    	grid.insert(p);
    	return false;
    }
    
    
    int main() {
    	freopen("sudoku.in", "r", stdin);
    	initializeRelation();
    
    	// Enter a sudoku puzzle: (9 lines with 9 characters on each line, use * for blank)
    	for (int i = 0; i < N; i++) {
    		scanf("%s", str[i]);
    	}
    
    	for (int i = 0; i < N; i++) {
    		if (strlen(str[i]) != N) {
    			exit(0);
    		}
    		for (int j = 0; j < N; j++) {
    			int idx = calcIdx(i, j);
    			if (str[i][j] == '*') {
    				g[idx] = s[i][j] = 0;
    				digitsUsed[idx] = 0;
    			} else if (str[i][j] >= '1' && str[i][j] <= '9') {
    				g[idx] = s[i][j] = str[i][j] - '0';
    			} else {
    				exit(0);
    			}
    		}
    	}
    
    	for (int idx = 0; idx < GRID_NUM; idx++) {
    		if (g[idx] == 0) {
    			for (int j = 0; j < 3; j++) {
    				for (auto & cur: r[group[j][idx]]) {
    					if (g[cur] != 0) {
    						digitsUsed[idx] |= 1 << (g[cur] - 1);
    					}
    				}
    			}
    			// pair is (digitsLeftCount, idx)
    			grid.insert(make_pair(calcUsable(idx), idx));
    		}
    	}
    
    	if (dfs()) {
    		printResult();
    		printFillableResult();
    	} else {
    		printResult();
    		fail();
    	}
    
    	return 0;
    }
    
    
    /*
    
    
    *23456789
    456789123
    789123456
    312645978
    645978312
    978312645
    231564897
    564897231
    897231564
    
    **95*8*7*
    23769***4
    5**32**1*
    8*1935**7
    49*8*2*51
    **3**6*2*
    *1*2*4**6
    6*8*****2
    *7*1*38**
    
    
    *****2***
    2*4****7*
    ****5**49
    **6**85**
    ******83*
    57**4****
    *3*7****6
    *65*3**9*
    7***9*1**
    
    */
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49
    • 50
    • 51
    • 52
    • 53
    • 54
    • 55
    • 56
    • 57
    • 58
    • 59
    • 60
    • 61
    • 62
    • 63
    • 64
    • 65
    • 66
    • 67
    • 68
    • 69
    • 70
    • 71
    • 72
    • 73
    • 74
    • 75
    • 76
    • 77
    • 78
    • 79
    • 80
    • 81
    • 82
    • 83
    • 84
    • 85
    • 86
    • 87
    • 88
    • 89
    • 90
    • 91
    • 92
    • 93
    • 94
    • 95
    • 96
    • 97
    • 98
    • 99
    • 100
    • 101
    • 102
    • 103
    • 104
    • 105
    • 106
    • 107
    • 108
    • 109
    • 110
    • 111
    • 112
    • 113
    • 114
    • 115
    • 116
    • 117
    • 118
    • 119
    • 120
    • 121
    • 122
    • 123
    • 124
    • 125
    • 126
    • 127
    • 128
    • 129
    • 130
    • 131
    • 132
    • 133
    • 134
    • 135
    • 136
    • 137
    • 138
    • 139
    • 140
    • 141
    • 142
    • 143
    • 144
    • 145
    • 146
    • 147
    • 148
    • 149
    • 150
    • 151
    • 152
    • 153
    • 154
    • 155
    • 156
    • 157
    • 158
    • 159
    • 160
    • 161
    • 162
    • 163
    • 164
    • 165
    • 166
    • 167
    • 168
    • 169
    • 170
    • 171
    • 172
    • 173
    • 174
    • 175
    • 176
    • 177
    • 178
    • 179
    • 180
    • 181
    • 182
    • 183
    • 184
    • 185
    • 186
    • 187
    • 188
    • 189
    • 190
    • 191
    • 192
    • 193
    • 194
    • 195
    • 196
    • 197
    • 198
    • 199
    • 200
    • 201
    • 202
    • 203
    • 204
    • 205
    • 206
    • 207
    • 208
    • 209
    • 210
    • 211
    • 212
    • 213
    • 214
    • 215
    • 216
    • 217
    • 218
    • 219
    • 220
    • 221
    • 222
    • 223
    • 224
    • 225
    • 226
    • 227
    • 228
    • 229
    • 230
    • 231
    • 232
    • 233
    • 234
    • 235
    • 236
    • 237
    • 238
    • 239
    • 240
    • 241
    • 242
    • 243
    • 244
    • 245
    • 246
    • 247
    • 248
    • 249
    • 250
    • 251
    • 252
    • 253
    • 254
    • 255
    • 256
  • 相关阅读:
    可靠性设计
    详解为什么v-if和v-for不能同时使用
    hive语法
    Spring5学习笔记08--Scope
    正则表达式相关概念及不可见高度页面的获取
    十二、消息服务(1)
    tkmybatis 权威指南 官方文档
    【JavaWeb的从0到1构建知识体系(六)】认识Mybatis(下)
    SSM整合
    16_Nginx_http请求处理的11个阶段
  • 原文地址:https://blog.csdn.net/samuelwyf/article/details/134486222