方力钧 《1996 No. 4》 布面油画 1996年
中国艺术大数据可信度不高
数据时代已经来临,但大数据并非无所不能。其核心不在规模大,它蕴含的是计算和思维方式的转变,过于乐观和简单的理解,都可能助长“大数据迷信”。毋庸置疑,规模更大、更新更快的大数据拥有深刻的洞察力,也将带来价值,但认为有了大数据就无所不能,却过于乐观和简单。现实中存在的样本误差和偏差等种种“陷阱”,不是单单依靠更大、更新、更快的数据就可以解决。
首先国内艺术品数据存在诸多问题:一是国内的艺术品交易分散、数据不全。一级市场以艺术家和代理人的私下交易为主,几乎所有艺术家都不可能向任何组织或机构汇报其每年的作品销售和收入情况,而代理机构为了逃税更不会对外界透露实情。二级市场主体是拍卖企业。他们的交易相对集中,每次的成交也有据可查。但是,并不是所有的拍卖企业都与编制机构有合作关系。二是艺术品本身存在异质性,交易难以标准化,数据分析难度大。三是行业普遍存在卖假和假卖的问题,尤其是拍卖成交数据,隐藏着大量水份和泡沫,至于画廊等艺术品代理机构提供的润格,则完全不需要标准和依据,其真实性也大打折扣。此外,数据编制机构本身的商业性质,计算模型的建立方式同样也在影响着数据本身的客观性、公正性和专业性。这在胡润艺术榜排名中都有所体现。
“艺术品的数据有干净的数据、可疑数据以及垃圾数据。干净的数据是已经及时清理过的准确的数据,而可疑数据和垃圾数据分别是那些有疑问的和没有用的数据。”孔达达表示,目前国内搜集到的基本都是二级市场的数据。这些数据主要源于十几个拍卖公司提供,仅仅是初始数据,里面有不少疑问数据和垃圾数据,对于那些竞拍后未付款或赝品等数据,国内还未及时清理,有时也会因为信息不对称而搜集不到。
任何数据都有源头,但并非全部出自可靠的来源,孔达达认为中国公开拍卖成交数据的可信度一直被业界所质疑,一方面由于时间和成本限制,数据采样过程难以做到绝对严谨,另一方面拍卖市场的假拍、造价等现象又进一步降低了数据的真实性,而大量存在的拒付款现象又深化了数据的偏离度。因此拍卖数据的可信度问题将长期困扰艺术市场专家和从业者。
低单纯数据分析引起的对市场理解的偏差的方法就是,在量化分析的同时强化定性分析的作用,即便是一份简单的市场报告或新闻报道,也绝不应该是一个机械性的数据堆积。
虽然数据有很强的说服力,但是如果来源不稳妥,或使用不恰当,其危害性可能比感性描述还要大。孔达达强调,“因为对于数据人们往往缺乏辨别力,而数据的来源背景可能比数据本身更不容忽视。单一或少数领域的大数据不仅价值有限,还存在片面性的危险。只有数据跨越了行业领域间的界限,关联性加强时,数据的准确性才会提高。”