模型是对现实的简化或近似,因此它们无法捕获所有现实。“所有模型都是错误的,但有些模型是有用的”,这是乔治·爱德华·佩勒姆·博克斯(George Edward Pelham Box,1919–2013)的一句名言。乔治·博克斯(George Box)是威斯康星大学的英国数学家兼统计学教授。统计人员开发理论模型以预测特定过程的行为。这句话的意思是,每个模型都将是错误的,并且从不代表确切的行为。但是,即使模型无法准确描述现实,但如果模型足够接近的话,它可能会很有用。在本文中,我们将探讨George Box的报价如何应用于机器学习模型。
机器学习(ML)中的模型开发是一个迭代过程,与统计模型开发完全不同。理论模型支持用于统计模型开发的方法,并且模型所做的预测将独立于模型开发人员。在机器学习中,建模是一门艺术,而ML模型产生的结果取决于艺术家,模型开发者。在机器学习中,我们有从事模型开发的不同类别的专业人员。
他们是软件工程师,机器学习工程师和数据科学家。这些专业人员的每个类别都从不同的角度看待模型开发。数据科学家永远不会对模型所做的预测感到满意,并认为仍然存在提高准确性的空间。但是,软件工程师和机器学习工程师容易感到满意,并倾向于认为从他们的模型生成的结果具有最高的准确性,没有进一步改进的余地。
机器学习模型的准确性还取决于所使用的算法。在机器学习中,我们必须从六种算法/库中选择一种。典型的机器学习算法/库是XGBoost,Random Forests,TensorFlow,Scikit-learn和Pytorch。在机器学习中,我们有能力运用人类的创造力,直觉,经验和领域知识来提高模型的准确性。因此,机器学习模型的准确性还取决于开发模型的专业人员。模型开发人员通过调整超参数来影响模型。超参数是用户定义的设置,它指示算法在训练期间应如何表现。
在机器学习上下文中,将报价修改为“所有模型都是准确的,但有些模型更准确”会更合适。祝您建模愉快。下次见。
关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!