引自免费微信小程序:皆我百晓生
在 stata 17 中,执行 crtrees
函数(适用于回归树)并查看缺失值时,可能会遇到两种情况:
- 第一行代码显示缺失值:这可能是因为第
option
参数没有被正确设置为'tree'
,这通常是在命令行界面中使用的默认选项。在 Stata 中,如果你尝试通过命令行界面输入命令,且未将option
参数设置为'tree'
,那么 Stata 将尝试使用默认的回归树模型 (regression trees
) 来计算特征和预测变量之间的关系。
例如,假设你的命令如下:
options option='tree'
srtree price trunk weight length foreign gear_ratio, seed(12345)
此时,如果 option
参数未设置为 'tree'
,Stata 将使用默认的回归树模型进行分析,并尝试推断参数值(例如,权重和长度)。然而,由于某些外生变量(例如外国齿轮比率)是连续值而不是离散值,因此 Stata 将无法直接用连续数据集中的观察值估计它们,而是需要通过计算离散嵌套特征(foreign gear_ratio
)与连续观测值之间相关性来估计这些数值。
为了解决这个问题,你需要确保将 option
参数设置为 'tree'
。以下是如何进行操作的步骤:
- 在命令行界面中,转到
data
目录并切换到要分析的数据文件(price
,trunk
,weight
,length
, 和foreign gear_ratio
)。 - 删除
option
参数前面的逗号,以便将其设置为'tree'
。例如,如果你将option
替换为tree
,你会看到修改后的命令:
options option='tree', seed(12345)
这样,Stata 就将会在解析数据时使用回归树模型,从而处理缺失值问题。
- 保存并关闭所有打开的 Stata 文件以确保更改生效。然后重新加载数据并应用这个调整后的选项。
例如,在 Stata 中执行上述操作后,当你再次运行 srtree
命令,你应该能看到缺失值已经被忽略,表示回归树成功地估计了连续变量和嵌套特征之间的关系。如果你想绘制回归树的图形,可以使用 crtree
函数的标准输出,或者在数据文件本身或命令行界面中运行 plot srtree
命令。以下是一个示例代码片段,用于绘制回归树:
plot srtree price trunk weight length foreign gear_ratio, seed(12345)
这将在工作目录中创建一个基于以上数据的回归树图形,包含参数 option
的值以及各部分的解释。
注意,代码以 code
格式提供,其中包含了必要的假设和调整选项(即 option='tree'
),以及你所需的回归树图形绘制命令。实际使用时,你可能需要根据具体数据格式和目标图形类型(如线性回归、分类回归、决策树等)进行相应的调整。