- 基于内容的服装图像情感语义识别和检索
- 张海波
- 1780字
- 2025-03-22 09:17:23
序
服装乃衣食住行之首,和每个人的生活都息息相关。服装最初的作用就是保暖、遮体等基本功能,但很快美观就成为重要需求之一。到如今,服装除了穿着舒适和工作需要之外,更重要的作用已经转移到与审美相关的个人感性需求和体现身份等功能,如何更好地满足这方面的需求已经成为服装行业的主要努力方向。
信息技术服务于服装行业已经有多年历史。计算机辅助服装设计已经广泛应用,网络购衣与试衣已经渐成时尚,相信随着信息技术的广泛应用,信息学科和服装学科的交叉更加深入。然而,由于服装融合了深厚的审美因素和个人感性色彩,用计算机处理服装信息还需要从建立合理的概念和意义入手,不断完善表达手段和方法。从这个意义上讲,信息技术服务于服装行业还有很长的路要走。
作为一个很有意义的探索,本书以男西装和服装面料为例,对基于内容的服装图像情感语义识别和检索问题进行了研究。针对男西装图像,经过主观情感测试、情感因子空间建立、情感因子和男西装图像颜色低层特征之间的关系分析、基于BP 神经网络的男西装图像情感因子自动计算,实现了基于内容的男西装图像情感语义识别和检索。针对服装面料图像,经过主观情感测试、情感因子空间建立、情感因子与服装面料图像颜色和纹理低层特征之间的关系分析、基于支持向量机的服装面料情感因子自动计算,实现了基于内容的服装面料图像情感语义识别和检索。实验表明获得了较好的识别和检索效果,在基于内容的服装图像情感识别和检索方面迈出了重要一步。
作者张海波是我高中同窗。虽然他所学非服装专业,但近些年来并未因学科的差异而有所踯躅,不仅在计算机与服装学科的交叉方面进行了不懈探索,而且很快就融入服装专业这个大方向,并在服装情感方面创出了一片新天地。他这种踏实、努力进取的精神在高中时期我就深有体会的,这也是我不避同学之嫌写序推荐的主要原因。事实上,我们早在2010 年就共同承担了北京市自然科学基金课题“服装图像情感语义理解研究”,合作开展了相关研究工作,其中的一些内容也已成为本书的素材,这里不再赘述。我想借此对这个方向的发展发表一点儿自己的看法,和大家讨论。
第一个看法来自我自己对“信息”概念的思考。正如控制论创始人诺伯特·维纳所言:“信息就是信息,既不是物质,也不是能量”。这实际上是说,信息与物质和能量一样,是构造我们这个世界的最基本的要素。我的看法是,信息根植于客观存在的形式属性,从这个角度看服装,其形式价值和遮体保暖的物质和能量价值一样重要,而且随着人类社会的发展,服装的形式价值已经成为它主要的存在价值。和服装( 衣)一样,建筑( 住) 、餐饮( 食) 、交通( 行) 也都从最初的物质能量需求演化为对形式的需要,并构成了人类文明和文化发展的主旋律。因此,从信息角度研究服装,研究空间十分广阔。
第二个看法是信息技术对服装研究会起到巨大的推动作用。信息技术能够从定量化的角度支持服装设计和相关研究,还能从大规模数据的高速实时处理角度发挥重要作用。目前,大数据已经影响社会的方方面面,服装学科和服装行业也不例外。例如,通过对互联网服装消费行为的统计分析,人们的服装偏好可以得到实时分析,相应地,对服装面料以及原材料、颜料的需求都可以得到定量化分析和跟踪,也就是说,服装行业也将是一个典型的信息驱动的行业。
第三个看法更乐观一些,那就是随着服装行业“信息化”的深入,计算机对服装的自动理解在不久的将来将成为现实。信息技术要深度服务服装行业,就需要能够自动理解服装款式,包括造型、面料以及情感色彩。实现这一目标的方法之一是把人类业已建立的服装标准等形成知识库,这是人工智能的传统思路,难点在于很难穷尽细节,也很难反映动态变化。随着大量数字化服装数据( 包括二维和三维的电子设计稿、网络商店的大量图像等) 的可用性,通过机器学习的方法自动建立服装知识库将成为可能,这将为人们选择甚至定制适合自己的服装打开大门。
当然,从信息技术角度看,对服装的自动分析和理解也是理解物理世界和人类社会的重要组成部分,图像识别和智能监控等领域检测识别主要关心人脸、车辆等典型对象,服装作为表征人的主要特征,重要性日益增加。作为研究图像和视频分析识别的一名科研工作者,很感谢本书给我这个机会与服装界的专家建立联系,希望在未来能够合作,共同推进计算机和服装这两个学科的交叉研究。
黄铁军
北京大学信息科学技术学院教授,数字媒体技术研究所所长
2014 年2 月