回调函数是一种编程概念,它主要与编程语言的功能和设计模式有关,而不是与算法思想直接相关。许多现代编程语言都支持回调,通常通过高阶函数或函数指针来实现。但并不是所有的编程语言都内置了回调。回调的实现更多地依赖于语言是否支持将函数作为参数传递或存储。例如,JavaScript、Python 和 C++ 都支持回调。
在很多编程框架和库中,特别是那些涉及事件驱动或生命周期管理的库,"hook" 是一个常见的概念。一个 hook 可以看作是一个回调函数,当某些特定事件或条件满足时,它会被触发执行。
关于 hook 的要点,以深度学习中一个evaluate过程为例:
- # register eval hooks
- if validate:
- val_dataset = build_dataset(cfg.data.val, dict(test_mode=True))
- val_dataloader = build_dataloader(
- val_dataset,
- samples_per_gpu=1,
- workers_per_gpu=cfg.data.workers_per_gpu,
- dist=distributed,
- shuffle=False)
- eval_cfg = cfg.get('evaluation', {})
- eval_cfg['by_epoch'] = cfg.runner['type'] != 'IterBasedRunner'
- eval_hook = DistEvalHook if distributed else EvalHook
- runner.register_hook(eval_hook(val_dataloader, **eval_cfg))
-
- if cfg.resume_from:
- runner.resume(cfg.resume_from)
- elif cfg.load_from:
- runner.load_checkpoint(cfg.load_from)
- runner.run(data_loaders, cfg.workflow)
注册 Hooks:
runner.register_hook()
方法允许我们为特定事件或条件注册回调函数(即 hooks)。当这些事件发生或条件满足时,这些回调函数会被自动调用。验证 (Validation) Hook:
validate
为 True
,则会构建一个验证数据集和相应的数据加载器。DistEvalHook
或 EvalHook
)。加载 Checkpoints:
resume_from
,则从该 checkpoint 恢复模型的状态并继续训练。load_from
,则从该 checkpoint 加载模型,但不继续从上次的训练状态开始。运行:
runner.run()
开始模型的训练。在此过程中,已注册的 hooks 会在适当的时间点被调用。Hook 的工作原理:
在底层,hook 的工作原理是基于事件驱动的模式。当发生特定的事件(例如,一个 epoch 的结束)或满足某些条件(例如,达到一定的迭代次数)时,框架会自动检查是否有为这些事件或条件注册的回调函数,并按照注册的顺序调用它们。
这种模式提供了极大的灵活性,因为它允许开发者插入自定义的逻辑,而不必修改框架的内部代码。例如,你可以很容易地为模型的训练过程添加自定义的日志记录、模型保存或其他功能,而不必更改训练循环的实际代码。