• 避坑必看:C++移植C语言结构体char短整形导致生产事故分析


    在C语言中,整数类型有很多类似UINT32这样的指代类型,以便在不同的字长的硬件里,确定使用特定长度(如32比特)的整数。在C中,从整形往字符串的转换一般是调用一些函数,如printf, 并人为指定一个类型说明符,比如 %d 来完成。若迁移C的工程到C++,则要额外注意类型的敏感性。在产生字符串时,不指定类型的C++调用,会把char作为字符处理,导致诡异的问题。

    下面这个例子就是最近协助解决的一个非常典型的类型问题,在一个生产系统里存在多年,直到传感器扩容后才爆发,造成了经济损失。

    acc

    1. C示意程序

    老版软件,使用一个结构体存储传感器的电压(代表温度),并插入到数据库里。由于是控制台程序,采用的是管道重定向,即直接生成INSERT语句,而后定向到数据库的控制台客户端中执行。

    #include <stdio.h>
    typedef struct tag_item{
    	unsigned int timestamp;
    	int vol;
    	char  machine_id;
    } ITEM;
    
    int main()
    {
    	ITEM item;
    	item.timestamp = 1646587837;
    	item.machine_id = 66;
    	item.vol = 12;
    	printf("INSERT INTO mlog(tmstmp,vol,machine) VALUES (%u, %d, 'M_%d');\n"
    		   , item.timestamp
    		   , item.vol
    		   , item.machine_id
    		   );
    	return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20

    此时,会输出:

    INSERT INTO mlog(tmstmp,vol,machine) VALUES (1646587837, 12, 'M_66');
    
    • 1

    这个例子里,machine字段在数据库里是字符串,因此采用引号包裹。但这种字符串类型的字段,是不会检查“66”这个整形的有效性的。

    2. C++Qt示意程序

    新版软件,是这样处理的:

    #include <QCoreApplication>
    #include <QTextStream>
    struct tag_item{
    	long long timestamp;
    	int vol;
    	char  machine_id;
    };
    
    int main(int argc, char * * argv)
    {
    	QCoreApplication a(argc,argv);
    	tag_item item;
    	item.timestamp = 1646587837;
    	item.vol = 12;
    	item.machine_id = 66;
    
    	QString sql = QString("INSERT INTO mlog(tmstmp,vol,machine) VALUES (%1,%2,'M_%3');\n")
    			.arg(item.timestamp)
    			.arg(item.vol)
    			.arg(item.machine_id);
    
    	QTextStream stm(stdout);
    
    	stm << sql;
    	return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26

    程序输出为:

    INSERT INTO mlog(tmstmp,vol,machine) VALUES (1646587837,12,'M_B');
    
    • 1

    注意到了吧?66被作为char类型的ascii码,转换为了"B"

    3. 问题的隐藏

    这个系统部署了3年了,产生无数的记录,但是一直都很正常。

    用户不知道正常的ID应该是M66,M67,负责的工人在界面记录的是 M_B,M_C。工人知道M_B在电镀车间,M_X在制氧车间的液箱里。如果当时安装传感器的师傅知道内部规则,就会发现水箱上贴的标记是诡异的。由于工程一期的传感器不多,传感器的取值恰好位于字母区,这个问题就一直隐藏在这里。

    此外,上位机上的程序过于简单,传感器首次上线,只是检查传感器的ID有无重复,并不检查取值。如果发现了新的传感器,则直接插入,并提示车间助理录入位置、温度报警范围等参数。系统部署以来,在界面上展示的始终就是 M_B这样的字母ID!就连公司的客服也以为这是正常的。

    4. 问题爆发和修复

    直到今年夏天疫情结束,生产线重启前,趁机批量更换并扩容,导致出现了反斜杠(92号传感器的ASCII)转译问题:

    INSERT INTO mlog(tmstmp,vol,machine) VALUES (1646587837,12,'M_\');
    
    • 1

    而这些有问题的语句导致事务的失败和回滚,同一个事务内的所有INSERT全部丢失。由此带来的温控系统得不到及时、正确的反馈,液体温度过热,生产线停机。解决的方法很简单, 强制转换为qint8:

    	QString sql = QString("INSERT INTO mlog(tmstmp,vol,machine) VALUES (%1,%2,'M_%3');\n")
    			.arg(item.timestamp)
    			.arg(item.vol)
    			.arg((qint8)item.machine_id);
    
    • 1
    • 2
    • 3
    • 4

    但是损失是很大的,造成了液料损失,和管道清洗损失共计20多万元。

    5. 问题测试

    问题根源是没有正确估计到C++的自动类型判断带来的潜在问题。C++自动通过类型来决定策略,可以用下面的例子具体观察:

    #include <QCoreApplication>
    #include <QTextStream>
    #include <iostream>
    struct tag_item{
    	long long timestamp;
    	int vol;
    	char  machine_id;
    };
    
    template <typename T>
    void test(T v)
    {
    	QTextStream stm(stdout);
    	stm << "typeid=" << typeid(v).name() <<"\n";
    	stm << "\tTest QTextStream : "
    		<< v
    		<< "\n";
    
    	stm << "\tTest QString()   : "
    		<< QString("%1").arg(v)
    		<< "\n";
    
    	stm.flush();
    
    	std::cout << "\tTest iostream    : "
    		<< v
    		<< "\n";
    }
    
    int main(int argc, char * * argv)
    {
    	QCoreApplication a(argc,argv);
    	tag_item item;
    	item.timestamp = 1646587837;
    	item.vol = 12;
    	item.machine_id = 66;
    
    	test(item.machine_id);
    	test((char)		item.machine_id);
    	test((qint8)	item.machine_id);
    	test((__int8_t)	item.machine_id);
    	test((unsigned char)	item.machine_id);
    	test((quint8)			item.machine_id);
    	test((int)				item.machine_id);
    	return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46

    输出为:

    typeid=c
    	Test QTextStream : B
    	Test QString()   : B
    	Test iostream    : B
    typeid=c
    	Test QTextStream : B
    	Test QString()   : B
    	Test iostream    : B
    typeid=a
    	Test QTextStream : 66
    	Test QString()   : 66
    	Test iostream    : B
    typeid=a
    	Test QTextStream : 66
    	Test QString()   : 66
    	Test iostream    : B
    typeid=h
    	Test QTextStream : 66
    	Test QString()   : 66
    	Test iostream    : B
    typeid=h
    	Test QTextStream : 66
    	Test QString()   : 66
    	Test iostream    : B
    typeid=i
    	Test QTextStream : 66
    	Test QString()   : 66
    	Test iostream    : 66
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28

    可见,无论是用标准C++或者Qt,都存在char类型的自动转换注意事项。

    (生产环境为传感器嵌入式Linux系统+Linux上位机)

  • 相关阅读:
    老杨说运维|今年这个会议非比寻常
    锐捷MPLS跨域方案A、B实验配置
    Zabbix使用手册
    聊聊我常用的5款动态数据可视化工具
    Python 实现获取【昨天】日期
    PMP_第4章章节试题
    Python数据分析与建模库-03数据分析处理库Pandas-1.数据读取
    使用Golang实现HTTP代理突破IP访问限制
    4.RabbitMQ 消息确认机制
    环境变量小节
  • 原文地址:https://blog.csdn.net/goldenhawking/article/details/125546566