本文章主要阅读评价 A031A335A441三组优秀论文。

问题描述

确定葡萄酒质量时一般是通过聘请一批有资质的评酒员 进行品评。

每个评酒员在对葡萄酒进行品尝后对其分类指 标打分,然后求和得到其总分,从而确定葡萄酒的质量。

酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄 酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒 和葡萄的质量。

附件1给出了某一年份一些葡萄酒的评价结 果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒 葡萄的成分数据。

请尝试建立数学模型讨论下列问题:

  1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信
  2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级
  3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系
  4. 分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?

阅读分析

标题

A441的标题很直白的直接给出 “葡萄酒的评价”,过于单调;而A335与之相比则是根据一步阐述了本论文的标题:葡萄酒的质量分析与评价,符合题目的基本要求,而且比之A441更加清晰。

A031的标题 “基于排序检验的葡萄酒评价” 则给出了该论文的主要方法,与上述论文相比则主题更加明确,在讲清楚问题的同时加入了论文的主要方法,让人更加容易接受并继续读下去。

摘要

横向对比三篇论文摘要的第一段,发现A441和A031比较相似,而且过于单调。

A335则是在简练阐述问题的同时,尽量给出了本论文所用到的方法,然后再在后面进行更加详细的描述,比起来更加丰富。

纵观三篇论文,A335的摘要部分更加完善和丰满,文字和结果表达都清晰明了,关键词的个数和要点也较为合理。

假设

假设部分,三篇论文都提到了“品酒员的打分公平可信”,“数据可靠”等类似的假设,这是对数据的合理假设,予以肯定。

此外,A031提出 假设酿酒工艺和贮存条件等对葡萄酒质量及理化指标无影响,A335提出 假设酿酒葡萄和葡萄酒的理化指标和芳香物质在一定时间内不发生改变,则是处于现实意义上的考虑,减小了不必要的误差问题。

数据预处理

由于原问题给出的附件中数据较多,为了更好的建立数学模型求解,需要对数据进行必要的清洗,其中,A335和A441在论文中都给出了数据清洗的一些描述。

二者均通过求取平均值等方式修正在附件中发现的错误数据,使得论文更具有说服力。

问题一

显著性检验

A441论文为了检验显著性差异,先是绘制频数分布图,通过观测初步猜测服从于正态分布,于是在利用SPSS软件绘制Q-Q图进行检验发现不符合。于是考虑采用 非参数检验进行求解,最终得到具有显著性的结论。

而A031论文则是在数据处理上先将问题通过排序转化,化简求解的难易度,然后同样利用 非参数检验秩和检验Wilcoxon 符号秩检验 进行对排序的检验,最终得到同样的结论。

A335论文则是直接利用双向方差分析法对评分进行检验。

其中,A335和A441均在得到结果后进行了 标准化处理并重新进行检验,使得模型更具有说服力。

综合来看,A441论文更好。

可信度评价

论文A335利用了原始数据、标准化方差分析以及基于置信区间的方差分析总结得出因此选取基于置信区间法处理的数据的方差分析结果作为评酒员的评价差异分析对象。考虑到显著性差异的比较中主要 进行F统计量的比较,最后得出相关结论。

A441论文根据问题设计了评价离散程度的指标,通过这种模型来进行可信度评价。

A031在上一小问的基础上得到相对理想排序,并通过方差求解的方式得到可信度评价结果。

综合来看,A335论文更好。

问题二

A031论文通过对芳香指标与香气评分的相关性分析,采用 TOPSIS法的秩次排序 并多次比较分组得到所需要的分级。

A335论文则是先通过查阅资料得到葡萄酒的大致分类指标体系,绘制分级图

指标体系

然后再进一步利用 K-mean 聚类 进行分类,再逐步细化和调整。

A441论文采用了 多元统计分析 中的逐步回归思想,将酿酒葡萄的理化指标作为自变量进行函数拟合,之后对样本进行Q型聚类得到分级,同时还对模型做了检验,验证其合理性。

综合来看,A335论文如何带有模型检验,则更好。

问题三和问题四

A031论文进行了主成分分析,对指标进行了降维处理,然后对化简后的多个指标进行回归分析;A335和A441均进行了关联度分析,利用基于逐步回归的分析方法对指标关系进行估计,同时A335还详细描述了算法步骤,各个方程的表达也清晰明了,因此对问题三而言,A335的观感更佳。

模型改进与推广

这一部分A335做得相对较好。

首先是对模型的科学性分析进行了简要评估,用多段文字详细阐述了在前面论文中用到的相关方法对该问题的求解的促进作用,这是另外两篇论文没有的。

然后,在慢慢分析模型的优点和缺点,整体描述和语言都详略得当,比较优秀。

不仅如此,A335的附录部分还把计算过程中的各类表格给出来了,涉及到的多个回归方程也一并给出,但是并没有涉及到代码的附录。