杜丹 赛博格读写:数智时代的人技交融与媒体生成
【摘要】 世界如今由不断升级的软件定义,并决定赛博格读写与媒体内容的生成。以软件的数字模拟、算法扩展和概率生成为出发点,借助后现象学理论审视这一现象,赛博格读写体现为人与软件的三重交融。“人—软件”的中介化读写以界面隐喻的方式开启单一媒体的数字化,为媒体内容铭刻上数据结构;“人+软件”的复合行动数据化海量多媒体,动摇了内容生产与分发中人的主宰地位;“人/软件”混合体用数据驱动媒体内容的深度杂交与概率文本的涌现,形塑自动运行的超媒体。数智时代的赛博格读写彰显人工智能与人类智能的交织,不仅塑造信息幻象,更会导致无限关联与有限认知之悖论。
【关键词】 赛博格读写;超媒体;数据主义
一、引言
世界如今由不断变化的软件定义,而不取决于工业化机器。这当然不是说机器硬件不重要,而是说自计算机普及以来,软件的应用、升级与算法迭代影响了出版社、报社、电视台和广告公司等传媒机构的内容生产,并帮助个人生产数字内容,从而形成普遍由软件参与塑造的媒体生态环境。正如我们已经习惯使用Microsoft Word写作,用Photoshop、美图秀秀编辑图像。如今,软件不仅赋能内容生产,还与人协同进化,通过深度学习,成为一种新的智能体。一些数字阅听平台、读书App和办公软件系统还广泛接入人工智能程序或智能插件,来提升内容生产与分发效率。伴随着计算机算力的提高,生成式AI业已从封闭领域逐步走向通用,成为数字内容的主要生产者。如文心一言、ChatGPT、Midjourney、Sora等就通过大模型的预训练,能读懂人类意图,并自动生成海量的数字内容。它们是作者或合著者,涉猎写作、编程、绘画与影视创作等。
数智时代的计算机软件能读会写,颠覆了以往人对读写的专有,表明“读写”不仅是人运用软件读取和写入数据信息(计算机专业术语),由此,本文首先分析我们使用内容开发软件的读写历程,然后引入后现象学家彼得-保罗·维贝克\(Peer-Paul Verbeek\)的“赛博格意图”理论,来思考人与软件的交互与融合。进而,通过详细分析赛博格的读写行动,来剖析数字媒体内容如何创生,及其带来的传播困境。还包括软件在人机交互中识别和理解人类指令,进而输出计算内容。这告诉我们,软件一方面是与人协作或辅助人读写的媒介,另一方面则彰显出不容忽视的自主读写能力。我们不能将软件视为人的读写工具,毕竟计算机软件作为身体的延伸和外化,已具备了自主的行动能力,且通过与人交互,影响了内容生产与信息沟通。
由此,本文首先分析我们使用内容开发软件的读写历程,然后引入后现象学家彼得-保罗·维贝克\(Peter-Paul Verbeek\)的“赛博格意图”理论,来思考人与软件的交互与融合。进而,通过详细分析赛博格的读写行动,来剖析数字媒体内容如何创生,及其带来的传播困境。
二、作为读写技术的内容开发软件
内容开发软件是一种通过人机信息沟通来生产媒体内容的读写技术。不同于笔、纸、打字机等传统书写技术,内容开发软件由计算机工程师、程序员、作家、艺术家和设计师等合作开发,是一系列关于文字、影像和三维数字内容生产的应用程序。它们由媒体格式、界面交互、数据结构、算法和数据库等基本组件构成,并凭借“数字模拟”“算法扩展”“概率生成”的技术逻辑与我们的读写实践协同进化。
(一)模拟:技术塑造数字环境
20世纪70年代,计算机先驱和图形用户界面之父艾伦·凯\(Alan Kay\)描述了一个数字化的技术愿景。他说:“正在研发一个笔记本大小的个人计算机\(Dynabook\),来处理几乎所有人的信息需求。而且,这个设备能凭借创造性思考超越人的视听,有足够的计算能力存储信息,以便以后检索数千页的参考资料、诗歌、信件、食谱、记录、图纸、动画、乐谱、波形、动态模拟,以及人们想记住和更改的任何其他内容。”艾伦·凯的设想基于罗伯特·维纳\(Norbert Wiener\)的控制论,指明个人计算机的输出必须以大量组合数据的输入作为前提。这种组合既有当下放进的数据,又有从过去存储的数据中取出的信息。当数据被写入计算机,就能指示机器组合信息进行输出。在这一程序化信息控制理念的推动下,笔记本电脑很快普及,各种计算机软件被编程,用以记录、存储、编辑和输出人类文明的数字成果。之后,软件技术的高速发展驱动了计算机软、硬件的分离,使得软件种类不断增加,计算与兼容性能得到持续提高,即执行不同任务的程序能在个人计算机上自动运行。而且,随着用户图形界面\(GUI\)的广泛应用,我们就能轻松实现人机交互。
软件的技术革新为数字化的内容模拟\(simulation\)打开了一扇大门。具体而言,内容模拟的一个关键手段是“界面隐喻”,即通过计算机的通用标记语言\(如“桌面”“布局”“画笔”“废纸篓”“放大镜”等\),让我们以后视镜的方式来理解所谓新技术的旧功能,进而便于读取和写入数据信息。于是,内容开发软件作为“仿真器”,既能模拟传统的二维书写、影像制作和三维塑造等行为,又能凭借特定的算法、数据结构呈现“逼真”的数字内容。正如Word模拟用笔书写,它赋能用户的复制、剪切、粘贴、插入、更改字体或文本颜色等行为;Photoshop仿真一系列传统画笔、描绘方式、色彩渲染等;我们用Premier模拟电影的信息流生产,如正向播放、反向播放、快进等;设计师在3ds Max中建模、贴图和渲染,来模拟石头、木材、黏土、塑料或混凝土等物质实体的塑造与雕刻等。
如今,内容开发软件的模拟功能已超越艾伦·凯的设想,赋能数字环境中更普遍、更深广的文字书写、影像制作和三维塑造。而且,当我们普遍接受程序的“界面隐喻”,将数字化作为一种基本的适应性方式,就必然会削减对书籍、照片、电影、黏土等物质技术的长久依赖,从而义无反顾地投身数字内容的海洋。而一旦物质被转化为数字,数字信息便能在人与机器、机器与机器之间传输和流动。
(二)扩展:算法加成内容编辑
数字内容由0、1二进制代码组成,虽有特定的媒体格式与数据结构,但并不完全独立,还能通过软件进行拆分、编辑和重组。这便体现了计算的开放性与软件的可扩展性。正如,我们常用的数字文档已不再是静态或平面的,还嵌入了动画或三维效果;一些读物能进行纸电声的网络联动……就此,马洛维奇描述说,“传统物理和电子媒介技术、再现格式,与计算机特有的新信息处理技术、数据格式,以新的组合形式被捆绑在了一起”。
计算机软件的扩展基于算法。我们熟知的“桌面”“文件”“文件夹”等就是通过算法进行扩展的结果,由此便具有了可检索、可分析和可视化的功能;数字文本的编辑也不仅在仿真传统书写,其内容生成与网络链接都普遍依赖计算;在图像编辑中,Photoshop通过算法预编程了水彩、油画、木刻等画笔,能自动渲染超预期的数字特效。致力于模拟工具和材料效果的算法,甚至还产生了一个重要后果,即随着参数变化,软件能计算生成完全陌生的内容。如在使用滤镜“波浪”时,滤波器的正弦波函数\(y=sinx\)的参数设置会使图像失真,让计算与现实世界的隐喻联系中断。
软件算法既能渲染数字特效,又被用于视图控制。在人机交互中,视图控制是一种通用的数字页面操控技术,赋能视图的切换、文本排序,并组织多级别的内容层次结构。软件中的“页面”“图层”等就是视图控制的常见模块,它们可以安置文本元素、存储数据信息,进而便于调整文本顺序、添加样式、控制透明度和可见性等。视图控制为数字内容的编辑增加了可视的纵横维度,并提供了文本链接与数字合成的技术条件,从而打破传统单一界面的固定模式,增强了内容编辑能力。
软件的算法扩展还体现在支持多人协作上。当前不少内容开发软件不仅无缝连接社交平台、数据库,还具有多人在线编辑和便捷的内容发布功能。腾讯文档就是一个支持在线创建、编辑和网络分享的多人协作式文字处理软件,它在我们的远程数字交往中发挥了不容忽视的作用。一些在线数字档案还通过谷歌地图的应用编程接口,来赋能世界各地的人们上传并读取数据信息。如乌多·诺尔\(Udo Noll\)和杰罗姆·乔伊\(Jérôme Joy\)发布的一个大型声音地图档案,就通过谷歌地图的应用编程接口\(API\),来赋能世界各地的人们上传并读取地方音景。
可见,软件的算法扩展赋能数字内容的生产。这一方面使软件的新模块、新功能、新插件得以不断研发与添加,新旧技术系统不断耦合;另一方面也增强了我们的内容编辑与合作能力,从而促成跨视图、跨平台与跨时空的读写实践,推进信息的沟通与交往互动。
(三)生成:模型涌现概率预测
马修·富勒\(Matthew Fuller\)提出,我们使用软件的读写行动存在着一个“临界点”。在这个点上,界面的解释性或结构性优势将随着计算机及其连接设备的突变能力而瓦解。而这已随AI内容生成软件\(集成了搜索技术、计算技术和学习技术\)的出现,成为现实。
生成式AI的运用突显了媒体内容从“生产”到“生成”的演变。在词源上,生成即“generate”,其词根“gene”指从父母转移到后代的遗传单位——基因,它决定了后代的某些自然特征。“generate”有导致、出现、形成和生产之意,如在数学中通过移动一个点、线或面来形成一条线、一个面或实体;或通过对词汇应用规则,产生一个有形式的句子。“generator”即生成器,意指具有某种转换、形成能力之物。就软件实践而言,生成式AI就是内容生成器,它通过提示词、参数、界面等来与人交互,实现了数字内容的一键式生成。
基于计算机诞生的控制论背景,本文所探讨的“生成”是指:人类的书写、读写经验作为程序自动生成的前提存在;在人机交互中,人类意图能够直接输入并转换为计算机的信息输出。由此,预设与生成是一对辩证统一体,即预设是生成的前提;生成是预设的结果;预设意味着计划与培育,具有相对的封闭性,而生成则体现为动态的开放,具有不确定性,它展现从一到多的自动演变过程,不排斥随机和偶然性。当然,生成并不独属于计算机程序,比如,传统书法实践基于长期训练,才能挥毫自如,让线条即时生成。其中线条生成的控制力量包括人\(决定方向、形态和表达\)、笔\(决定粗细、软硬\)和纸张\(决定渲染、质感\)。书法家的技艺与经验则保证了线条在不同作品中形成新的表达,且在不同时期实时生成。因此,传统书写是技术具身的行为,更是情感的流淌或意识的显化,其生成的线条具有生命力与创造力,难以测量。这与生成式AI的理性计算迥异。
生成也是计算机科学的概念。由于计算机的生成不是生命体的行动,其运行过程基于理性的时间分割与量化,因此其生成内容的过程是分步骤、可测量和可计算的。在图形学领域,生成即软件的算法生成,通常取决于所要生成对象的数学函数。算法生成如今已规模化应用于人工智能生成内容\(AIGC\),包括了文生文、文生图、文生视频、图生视频、视频生成其他视频等多模态应用。
AIGC的预设条件是社会技术系统配置的数据、算法和算力资源。其生成过程可简要概括为:模型接受海量数据输入,在充足算力的支持下,产生合理、有用和跨语境的算法输出。换句话说,AIGC以数据为基础,有赖于算法训练模型;海量数据能更好地进行训练,算力充足才能保障预测内容的涌现。就生成结果而言,由于AI模型的诞生源自科学发展史上的概率革命和统计革命,因此人工智能的算法生成基于世界的模糊性,放弃了准确性,而追求语言实践的“概率性”与跨情境运行的“生成性”。
控制论意义上的内容生成还离不开自我反馈与人类反馈。自我反馈旨以对抗的方式进行自我纠错,人类反馈则通过强化学习\(RLHF\)来提高生成内容的质量。如今,强化学习在模型训练中正发挥显著作用,主要是指编程者对AI模型进行“预训练”和“微调”。在此过程中,预训练帮助模型从数据学习,来掌握事实描述与对话能力,然后由训练员在一个更窄的数据集中对模型进行微调,通过强化微调准则,来规范AI模型对用户输入作出“合理”的概率预测。之外,人类反馈还包含用户交互行为中的自定义,用以提高生成内容的准确度。这样,AI模型就能深度学习人类的文明成果,并让生成的内容与人类常识、认知、价值等基本对齐。
可以看出,生成式AI通过模型训练、与人互动和强化学习来自动涌现概率性计算结果。由于AI模型既学习了已知的文明成果,又读取了大量人机交互数据,它们便能模仿人类读写,生成我们可理解的内容,并彰显其超越人的计算能力。不容忽视的是,虽然生成式AI具有自主性,但它们只有与人类智能深度交织,且不断满足人的读写需求,实现信息交换、数据可视与价值对齐,才能体现生机与活力。而且,生成式AI并非软件技术线性进化的结果,其涌现与可沟通能力的提升依然有赖于进一步的数字模拟和算法扩展。
通过梳理内容开发软件的进化历程,可知读写技术的演变经历了从数字模拟、算法扩展到概率预测,其中突显了人与软件技术的亲密接触、数字内容从“生产”到“生成”的变迁,以及新旧内容的延续、断裂与重构。这驱使我们进一步追问:在软件自主性逐渐增强的过程中,人与技术到底呈现了怎样的交融关系?接下来,本文将引入维贝克的赛博格意图理论,进行详细剖析。
三、赛博格的读写意图
维贝克认为,我们一直是赛博格\(即半机械人,一半是有机的,一半是技术的\),因此人与技术的关系不仅是唐·伊德\(Don Idle\)所言之中介、它者与背景关系,更是融合\(merge\)的。在他看来,赛博格的存在不仅超出了人与技术的关联和交互,还在物理层面改变了人及其文化实践。正如没有书写技术,我们的文化解释框架就会完全不同。
维贝克进一步指出,意向性\(intentionality\)是理解人与世界关系的核心概念,赛博格意图体现了人与技术的三重关系:当人的意图“通过”技术物件发生时,产生技术中介化的意向性;人的意图和技术意图之“叠加”,产生复合意向性;当技术与人“融合”时\(非相互作用\),就形成混合意向性。第一重赛博格意图是对伊德所言之技术中介化意图的继承;第二重推进了人与技术诠释、它者关系的研究;第三重则走出人本主义的藩篱,开启了从“人类技术\(anthropotechnologies\)”出发的探索。就此,维贝克指出人类使用的技术是构成不同“超人类\(transhumanist\)”的技术,应超越人文主义对人、人性与文本的关注,思考“人类技术”混合体及其行动。维贝克彻底地将人、技术与世界融合到了一起,这为本文探讨人与软件的交融提供了理论资源。
运用该理论,本文将数智时代人与软件技术的关系概括为中介、复合和混合。具体而言,当人使用软件时,技术中介化的意向性表明人的意图由计算机软件介导。人不会直接体验数字世界,而总是通过软件来塑造人与数字世界的特定关系。由此,“人—软件”的读写行动与体验由人类主导,软件会中介数据信息的读取与写入。毕竟,如果没有软件,人类就无法拥有具体的数字体验。复合意向性表明人与软件都具有行动者的意图,即当与人协作时,计算机软件作为它者也起着核心作用。“人+软件”的复合意向性也发生在伊德所言之人与技术的诠释关系中,涉及软件作为非人行动者对数字世界的算法生成,从而体现双重意图,即软件朝着它的世界行动;同时,人朝着软件意图的结果行动。赛博格的复合意向性具有软件增强人类智能和建设性意涵。混合意向性基于人技融合\(即半机械人\),是指在具身关系之前,软件与人实际上就是融合的,而不是被体现于身体。随着深度学习带来软件自主性的增强,赛博格的混合意向性便催生了“人/软件”智能体。
赛博格的读写意图表明人与软件的交融呈现多重面向。我们不能仅仅将软件视为中介,又或强调其作为它者存在,否则就会将我们的读写实践局限于软件的中介性或它异性上,导致人、技术与世界的分离。更为重要的是,随着当前AIGC领域人工智能与人类智能的深度交织,人与软件的边界模糊,尤其彰显出混合智能体的行动意图。因此,我们尤其应聚焦“人/软件”智能体的读写行动,来深入剖析组织媒体内容生成和涌现的新方式。接下来,本文将分别对中介、复合与混合的赛博格读写进行详细阐释。
四、赛博格的读写行动
(一)中介行动:单一媒体的数字化
赛博格读写首先体现为人与技术的中介关系,即人通过内容开发软件展开读写行动,软件介入、调节并形塑我们的媒体内容生产。而探讨软件如何影响我们的行动与体验,则有必要对传统书写技术及其中介化进行回溯。
早期人类的书写实践涉及使用纸、笔、墨等工具书写一个个空白页面,来探索文本编码的潜能及其可沟通性。正如约翰·杜海姆·彼得斯\(John Durham Peters\)所认为的,书写如“船”,使言语的海洋变得可通行。中世纪时,欧洲僧侣在手抄本上创造出多页面的垂直形式,从而革新了单一页面的空间结构。多页面在书籍演变中具有决定性意义,这是因为它用一系列界限分明且不连续的统一体,取代了卷轴这个均匀而连续的空间,将书籍塑造为了一个自足的整体;而且,由于书页数量增加,便于分离、查找和读取文本段落,使空间的信息容量也更大了。手抄本之后,人们凭借雕版和活字印刷术手工复制书籍。现代印刷术则通过机械复制进一步推动了书籍的空间生产、内容存储与信息传播。
如果说上述传统书写技术的中介化是近距离的,那么19世纪的现代技术带来的则是人的远距离书写,如采用光学装置显像,用声音刻录技术存储与播放唱片,以及通过信号传递电报信息等。远距离书写一方面表明摄影、留声机、电报的底层逻辑仍然是技术的中介化;另一方面则意味着现代技术革命带来了媒体内容生产的多样化与时空扩散——以光学装置、声音刻录和电报为代表的书写技术“打破了文字具有的所谓能指之垄断”,彰显出一种先进的人类操纵影像、声音和电磁信号传播的能力。
上述书写技术创造的都是具体且单一的媒体内容,而当计算机软件走进人类的读写实践中时,我们无疑便拥有了模拟上述传统技术与行为,用特定的算法整合、重塑其解释性结构的能力。具体而言,人们在界面上通过参数、菜单、对话框等可轻松操控一个个虚拟实体、文本时空及其动态链接的型构过程;反之,界面后台运行的算法也塑造着人的读写行动,让人在技术环境中直观体验到一件件数码实在物的创建与显现\(数字模拟中每一个工具、命令、菜单、参数运行都有一种单独的算法\)。软件的算法、界面在与人交互时也是媒体内容的解释者,它们通过投影其所渲染的虚拟实体,向人敞示与言说,也供人编辑、存储与读取。正如富勒研究Microsoft Word时所说,软件结合了自动化生产线、控制中心和安全系统,既保证了书写的流程及其稳态,又通过参数、菜单、对话框等对用户行为进行引导。正是算法的中介化让数字内容在屏幕上动态显现。
算法中介的行动不仅从物质技术中解放了媒体内容的生产,还为内容铭刻了一种特定的数据结构。在数字成像中,图像像素和矢量图形这两种数据结构,就替代了所有物质材料。马洛维奇就此指出,“如果效果以前是特定工具和材料之间相互作用的结果,那么现在它们是不同算法修改单个数据结构的结果……因此我们现在可以用单个软件来模拟不同媒体内容的创建、修改和组合,同时也能添加以前不存在的新技术,只要它们能在相同的数据结构上运行即可”\(14\)。可见,数据结构形塑数字媒体,让它们与传统媒体内容有了本质区别。
如今,轻松“上手”的内容开发软件凭借算法和数据结构在一定程度上已取代传统书写工具,成为赛博格读写的技术基底。这使我们更“自然”地接入数字生产的技术环境,从而更普遍地数字化媒体内容。而一旦文字、影像、三维等单一媒体都被铭刻上特定的数据结构,我们就不得不升级计算机的计算能力,以应对大规模数据化的挑战。
(二)复合行动:数据化与多媒体的共创
如果说技术中介化的读写行动基于人的意图,那么,“人+软件”的复合行动则突显出软件技术的自主性。在软件设计领域,软件自动化性能的提高有赖算法,算法由编程者设计,诸如Excel的列表计算、美图秀秀的图像计算、Google Scholar的文献检索等,都充分展现了算法能力的增强及其对日常生活与工作的渗透。可以说,正是算法的优化与自动计算能力决定并响应我们的上手行动,让读写过程更流畅、更稳定和高效。因此,大多数操作者虽然不知道算法的技术逻辑,但普遍依赖与之协作,来增强自身的数据处理能力。
算法是一个数据处理技术。彼得斯认为,早期人们用书写来计数和记账,后来才成为存储言语、记录法律或文学的载体。\(15\)可见,人的行为与思维是可计算的。计数行为早于数字,数字计量驱动了算法诞生,进而数据化特定的媒体内容。数据化\(datafication\)就是人脑运用算法将一种现象转变为可制表分析的量化形式过程。今天,我们与算法增强的数据处理技术协作,将原本对言语、面积、时间的制表计算,扩大到了对文字、影像、三维等内容的量化,从而体现了数据化万物、模拟世界的潜能。由此,数据化成为一种科学的内容生产范式。软件取代传统书写技术,成为协助人、掌管大规模量化、记录和计算过程的数据管理员。
人与软件的复合计算不仅数据化媒体内容,还能敞示新的媒体时空。在时间层面,随着计算能力的飞跃,软件算法能更高效地协助人完成计量和内容生产。比如通过输入具体材质、尺寸、光线和形态数据,软件就能预编程某种设计风格,并通过参数、菜单、对话框等引导我们的信息交互与内容编辑;不仅如此,不同的数字模块还能重组与拆分,实现文字、影像、三维等内容的非线性编辑。因此,与传统书写技术相比,算法能更好地与人一道管理线性与非线性相结合的数据信息流。之外,“人+软件”的复合计算还拓展了数字媒体的空间形态。比如数字文档既可分页、自定义大小,又能轻松与其他文档建立网络超链接;在各种图书阅听平台上,书籍图像被转化为了字、词、句和段落等文本数据,既便于计算机的信息处理,又拉近了人们的远程检索和读写;不少在线协作软件还通过互联网建立起云端的数据处理平台和资源库,以支持多人在线编辑和数据共享。由此可见,“人+软件”的复合计算能将信息从文本、意义及其载体中剥离出来,加速其数据化流通;同时,它也在字符与字符、字符与文档、文档与文档、人与数字媒体之间建立起数据信息交换的网络,以至于海量的数字媒体得以共创。
海量的数字媒体即“多媒体”。它继承了传统量化的基因,数据化多重媒体内容及其交叉与组合,能表征大量已知事实\(拉丁语中数据即已知、事实\),而这显然是传统书写工具难以大批量、同步且自动实现的。用马洛维奇的话来说,多媒体的诞生如同生物进化,不同的DNA组合产生了不同的“物种”。数字媒体的DNA无疑就是数据,数据的交叉与组合形塑了海量多媒体;由于数据纷繁,难以分辨准确或错误,因此数据组合与DNA组合一样,无法固守“物种”的精确度,只能承认多媒体内容的碎片、异质与混杂。
数据化不仅催生海量多媒体,还决定了媒体内容的分发权。随着数据规模变大、混杂增强、算法运行速度加快,内容如何分发就通常由人工智能软件来自动决策,而不再是人类。正如许多世界知名流媒体平台\(如奈飞\)都曾组织专业人士在图书、视频网站上进行推荐和评论,但自从采用人工智能软件分析数据与自动推荐之后,销售量就远远超过了专家推荐的贡献。为此,不少流媒体平台都放弃了成本更高的专家,而依赖大数据的算法推荐。显然,在这场机器完败人的竞争中,软件比人更有说服能力,其凭借算法在用户与内容之间建立起自动的个性化关联,从而掌管了内容分发权。作为一种弱人工智能,软件取代人会导致一个颠倒的结果——即软件将编程者、操作者作为中介,来获取计算运行的动力,从而动摇长久以来中介化读写实践和信息传播中人的主宰地位。
简言之,在“人+软件”的读写行动中,内容开发软件作为一名精通计算的行动者——包括数字计量、信息交换、数据组合和内容分发,与人协作且共创了海量多媒体。在此过程中,软件算法既建设性地增强人类智能,更在数据化、媒体杂交和定量分析中彰显出超越人的潜能。由此,弱人工智能会凭借大数据处理能力逐步进化为强人工智能。鉴于弱人工智能的存在基于人机交互,而“强人工智能可以看作是人机融合”,接下来,本文将进一步详细剖析人与强人工智能的混合行动。
\(三\)混合行动:型构数据驱动的超媒体
海量多媒体的泛在,为我们提出了一个生存性难题——即随着媒体内容的数据量递增,我们该如何在信息海洋中游弋?本文认为,只有与软件深度融合,我们才能凭借“人/软件”智能体的行动迎接这一挑战。如今,以ChatGPT、Midjourney、Sora等为代表的强人工智能不仅具有它异性,其神经网络还与人脑深度融合,形塑出人机混合智能体\(见图1\)。彼得·斯洛特迪克\(Peter Sloterdijk\)就此指出,“人机混合体正在成为一个由信息连接在一起的集成且可操作的系统。于是,我们才学会了新的读和写”。斯洛特迪克一方面指明人、技术和复杂信息系统的融合,另一方面也告诉我们信息系统不仅集成且可操作,还会重塑我们的读写实践。基于此,混合智能体的读写实践就是在一个复杂信息系统中的行动;作为控制论有机体,混合智能体与信息系统同构。而这一关乎生存的可操作方式则由数据驱动内容生成来实现。
图1 人机智能混合体(创
身处复杂的信息系统,编程者首先要标注数据。历史上,分类法和索引是最常用的数据检索方法,比如传统图书馆通过标注卡片来实现信息的分类和索引。基于小数据的卡片式分类和索引有效,但如果扩大数据规模,就可能无效。由此,数据标注成为当前分类、定位和索引海量数据的有效方法。然而,数据标注工作量巨大,不可避免会错标,因此无法保证准确性。这一方面表明媒体环境错综复杂,另一方面则告诉我们,“只有当标注数据足够多、放弃数据的准确性时,我们才可能获得多样的可能性”。
数据标注的现实促使非关系型数据库诞生——它无需预先设定复杂结构,就能提供读写、处理和存储超大规模的数据资源。这样的存储方式不可避免地去掉了数据的关系性,但也增强了数据可扩展的能力。因此,与传统数据库不同,非关系型数据库不会向人提供唯一答案,而是随着数据量与交互的大幅增加,不断地涌现解决方案。舍恩伯格就此认为我们不得不在数据缺陷和效率之间做出选择,“宽容错误会给我们带来更多价值”。正如许多翻译软件的语料库数据都来自未经过滤的网页内容,其中包含着各种各样的错误,也没有人工纠错,但正因此它们才成为合格的“翻译官”。毕竟,只有强调数据完整、接受它的混乱性和不确定性,才可能不断接近事实的真相。于是,互联网\(拥有95%非结构化数据和5%结构化数据、数据量约三年翻一番\)就理所当然地成了编程者训练大模型的主流数据库。
如果说编程者在信息系统中作为大模型的“伺服”存在,那么操作者的“投喂”在内容生成中同样不容忽视。由于大模型的概率预测有赖于人类反馈,因此操作者及其投喂可被视为促成程序一键式生成的中介。这种简化的操作模式会将原本主动的操作者转变为弗卢塞尔所言之装置的“功能执行者”。毕竟,大模型也需要操作者提供能量,并在算法生成的合理性和速度方面配合程序的自动运行。换句话说,表面上看是操作者在生成式AI的界面上点击生成媒体内容,但实际上混合行动中大模型通过操作者的主动投喂,彰显出自动涌现的能力且形塑了混合体的黏性。
通过数据标注、数据投喂和模型训练,混合智能体便能凭借一种自动机制计算生成概率文本。概率文本不同于单一媒体与多媒体,其生成动力来自数据,取决于由数据节点、链路和网络组成的一种非线性组织。在数据驱动下,概率文本能自动链接与追踪离散的数据节点,并组成包括文字、影像、三维等多媒体内容的复杂信息网络。而且,由于媒体杂交在数字环境中非常普遍,因此通过数据节点建立各种变体的非线性关联就显得至关重要——即在数据驱动下形塑导航链,将多媒体内容的相关数据节点连成导航图,来导引概率文本的涌现。
数据驱动的导航链分为实链与虚链。实链运行时数据节点直接连接且信息不会改变;而虚链则是在运行中经过程序化计算连接而成。由于概率文本的网络关系是多对多的,因此,计算生成的虚链能为我们提供目标不确定的信息,也可以在目标数据节点无法被访问时提供随机替代,连接与之有关的其他链路。实链与虚链并非对立,而是交织在复杂的数据导航之中。如果我们将实链看成基于人价值“算计”的有限数据节点之间确定的关系网络,那么,可导航的虚链就是模糊“计算”的结果。虚实导航链的交织无疑体现了算计与计算的密不可分——计算的过程中需要算计来指引方向,算计的过程中也需要用计算来完成基础性工作。二者缺一不可,只有二者结合才能实现更好的智能。由此可见,数据驱动的概率文本涌现虽是可预测的,但具有不确定性,因为数据“看似客观、精确和可复制,却可以用来讲述各种各样的故事”。数据可视化甚至会让事情变糟,正如我们在畅想强人工智能会颠覆人的创造性实践时,发现其并不可靠,经常出现推理和事实上的错误,一些计算结果甚至背离常识。
混合智能体处理非线性数据关联、涌现概率文本的巨大潜能,形塑出一个能自动运行的复杂信息系统——“超媒体\(hypermediacy\)”。ChatGPT、Midjourney、Sora等就是当下的典型代表,它们不仅吸纳人类的劳动、知识和经验,还像“云”一样不断地交叉、组合与变幻……这无疑改变了我们的读写实践且重塑了信息传播的自动机制。在此意义上,超媒体是一个容器,承载着赛博格的数据存储、标注、训练与投喂等行动;超媒体也是一个无边界且动态运行的网络化系统,由异质性媒体内容组合而成,没有物理意义上的开始、中间和结束,且依赖数据驱动信息的关联、组合与流动;超媒体更是一个控制论意义上的有机组织,它用数据驱动信息输入、链路计算与内容涌现,营造出深度杂交的媒体生态环境。对于信息传播而言,深度杂交意味着过去、现在和未来的媒体内容都融入其中,它们会混合、杂交与变异,进而塑造信息幻象。
五、结论与反思
数智时代的“赛博格读写”体现人与内容开发软件的三重交融。通过详细剖析中介、复合和混合的赛博格读写,本文揭示媒体内容创生过程中人与软件的多重关系向度,尤其突显当前人工智能与人类智能交织的现实,并指明赛博格的混合读写营造出深度杂交的媒体生态环境,从而为数智时代的信息传播提供“无限”可能。然而,我们却不得不因“无限”而与一个悖论难题纠缠搏斗。这是因为,基于大数据信念的“无限”或许只是一个信息涌现的幻象,它恰恰反映了我们的“有限”认知——即超媒体生成的海量内容基于有限数据的统计,且是一个个算计和计算耦合的关联性结果。
更为严峻的危机是:如果数据被人为有目的地训练、诱导、删减与微调,那么无限关联还会滋生知识操控与信息传播的风险,导致我们只知道“是什么”,而无视“为什么”。在知识操控层面,随着强人工智能不断发展,技术会重新定义言传知识,将它退化为一种技术施展的“魔法”。毕竟言传知识建立在对信息的提炼、归纳和逻辑推理之上,而秉持数据主义的技术专家则相信它由纯粹的相关性决定,如果拥有足够多的数据和分析能力,就能塑造知识权威。在信息传播层面,赛博格的混合行动会形塑一种数据驱动的传播新生态。一方面垃圾信息的生产永不停息且泛滥,会不可避免地导致交往沟通的困境;另一方面则会带来严峻的信息操控危机——即数字巨头凭借超媒体引导社会公众舆论,操控人的行为。因此,我们须要批判其中的“数据主义”\(dadaism\)意识。
当前,在社会、研究和商业的交叉点上,数据化正扮演深刻的意识形态角色。这使得我们生活的现实通过数据实现了客观化\(objectivization\),事实通过算法则达成了主观化\(subjectivization\)。数据主义者甚至认为,生命体本身也是一种算法,可被简化为一组数据,且能通过编程算法进行重组,以寻求理想的结果。于是,大数据和算法作为一个新的“神话”,成为这个时代所有答案的最高权威来源。这导致我们普遍相信大数据所谓的客观、中立和革命性,且自愿地信仰它,进而深陷在各种人工智能竞赛、宣传云和云之战中。因此,如何消除盲目的数据崇拜,来对抗谎言与扭曲,抵御冗余和虚无的信息幻象,就显得尤为迫切。诗人艾略特\(T.S.Eliot\)曾说:“到哪里去找回我们在信息中丢失的知识,到哪里去找回我们在知识中丢失的智慧?”——这无疑是一条艰难之路。
杜丹,苏州大学传媒学院副教授。
全文载《现代传播(中国传媒大学学报)》2024年第5期,参考文献从略,引用请参考原文。
本文转自 | 数字交往
赛博格读写:数智时代的人技交融与媒体生成——基于软件实践的经验视角
【摘要】 世界如今由不断升级的软件定义,并决定赛博格读写与媒体内容的生成。以软件的数字模拟、算法扩展和概率生成为出发点,借助后现象学理论审视这一现象,赛博格读写体现为人与软件的三重交融。“人—软件”的中介化读写以界面隐喻的方式开启单一媒体的数字化,为媒体内容铭刻上数据结构;“人+软件”的复合行动数据化海量多媒体,动摇了内容生产与分发中人的主宰地位;“人/软件”混合体用数据驱动媒体内容的深度杂交与概率文本的涌现,形塑自动运行的超媒体。数智时代的赛博格读写彰显人工智能与人类智能的交织,不仅塑造信息幻象,更会导致无限关联与有限认知之悖论。
【关键词】 赛博格读写;超媒体;数据主义
一、引言
世界如今由不断变化的软件定义,而不取决于工业化机器。这当然不是说机器硬件不重要,而是说自计算机普及以来,软件的应用、升级与算法迭代影响了出版社、报社、电视台和广告公司等传媒机构的内容生产,并帮助个人生产数字内容,从而形成普遍由软件参与塑造的媒体生态环境。正如我们已经习惯使用Microsoft Word写作,用Photoshop、美图秀秀编辑图像。如今,软件不仅赋能内容生产,还与人协同进化,通过深度学习,成为一种新的智能体。一些数字阅听平台、读书App和办公软件系统还广泛接入人工智能程序或智能插件,来提升内容生产与分发效率。伴随着计算机算力的提高,生成式AI业已从封闭领域逐步走向通用,成为数字内容的主要生产者。如文心一言、ChatGPT、Midjourney、Sora等就通过大模型的预训练,能读懂人类意图,并自动生成海量的数字内容。它们是作者或合著者,涉猎写作、编程、绘画与影视创作等。
数智时代的计算机软件能读会写,颠覆了以往人对读写的专有,表明“读写”不仅是人运用软件读取和写入数据信息(计算机专业术语),由此,本文首先分析我们使用内容开发软件的读写历程,然后引入后现象学家彼得-保罗·维贝克\(Peer-Paul Verbeek\)的“赛博格意图”理论,来思考人与软件的交互与融合。进而,通过详细分析赛博格的读写行动,来剖析数字媒体内容如何创生,及其带来的传播困境。还包括软件在人机交互中识别和理解人类指令,进而输出计算内容。这告诉我们,软件一方面是与人协作或辅助人读写的媒介,另一方面则彰显出不容忽视的自主读写能力。我们不能将软件视为人的读写工具,毕竟计算机软件作为身体的延伸和外化,已具备了自主的行动能力,且通过与人交互,影响了内容生产与信息沟通。
由此,本文首先分析我们使用内容开发软件的读写历程,然后引入后现象学家彼得-保罗·维贝克\(Peter-Paul Verbeek\)的“赛博格意图”理论,来思考人与软件的交互与融合。进而,通过详细分析赛博格的读写行动,来剖析数字媒体内容如何创生,及其带来的传播困境。
二、作为读写技术的内容开发软件
内容开发软件是一种通过人机信息沟通来生产媒体内容的读写技术。不同于笔、纸、打字机等传统书写技术,内容开发软件由计算机工程师、程序员、作家、艺术家和设计师等合作开发,是一系列关于文字、影像和三维数字内容生产的应用程序。它们由媒体格式、界面交互、数据结构、算法和数据库等基本组件构成,并凭借“数字模拟”“算法扩展”“概率生成”的技术逻辑与我们的读写实践协同进化。
(一)模拟:技术塑造数字环境
20世纪70年代,计算机先驱和图形用户界面之父艾伦·凯\(Alan Kay\)描述了一个数字化的技术愿景。他说:“正在研发一个笔记本大小的个人计算机\(Dynabook\),来处理几乎所有人的信息需求。而且,这个设备能凭借创造性思考超越人的视听,有足够的计算能力存储信息,以便以后检索数千页的参考资料、诗歌、信件、食谱、记录、图纸、动画、乐谱、波形、动态模拟,以及人们想记住和更改的任何其他内容。”艾伦·凯的设想基于罗伯特·维纳\(Norbert Wiener\)的控制论,指明个人计算机的输出必须以大量组合数据的输入作为前提。这种组合既有当下放进的数据,又有从过去存储的数据中取出的信息。当数据被写入计算机,就能指示机器组合信息进行输出。在这一程序化信息控制理念的推动下,笔记本电脑很快普及,各种计算机软件被编程,用以记录、存储、编辑和输出人类文明的数字成果。之后,软件技术的高速发展驱动了计算机软、硬件的分离,使得软件种类不断增加,计算与兼容性能得到持续提高,即执行不同任务的程序能在个人计算机上自动运行。而且,随着用户图形界面\(GUI\)的广泛应用,我们就能轻松实现人机交互。
软件的技术革新为数字化的内容模拟\(simulation\)打开了一扇大门。具体而言,内容模拟的一个关键手段是“界面隐喻”,即通过计算机的通用标记语言\(如“桌面”“布局”“画笔”“废纸篓”“放大镜”等\),让我们以后视镜的方式来理解所谓新技术的旧功能,进而便于读取和写入数据信息。于是,内容开发软件作为“仿真器”,既能模拟传统的二维书写、影像制作和三维塑造等行为,又能凭借特定的算法、数据结构呈现“逼真”的数字内容。正如Word模拟用笔书写,它赋能用户的复制、剪切、粘贴、插入、更改字体或文本颜色等行为;Photoshop仿真一系列传统画笔、描绘方式、色彩渲染等;我们用Premier模拟电影的信息流生产,如正向播放、反向播放、快进等;设计师在3ds Max中建模、贴图和渲染,来模拟石头、木材、黏土、塑料或混凝土等物质实体的塑造与雕刻等。
如今,内容开发软件的模拟功能已超越艾伦·凯的设想,赋能数字环境中更普遍、更深广的文字书写、影像制作和三维塑造。而且,当我们普遍接受程序的“界面隐喻”,将数字化作为一种基本的适应性方式,就必然会削减对书籍、照片、电影、黏土等物质技术的长久依赖,从而义无反顾地投身数字内容的海洋。而一旦物质被转化为数字,数字信息便能在人与机器、机器与机器之间传输和流动。
(二)扩展:算法加成内容编辑
数字内容由0、1二进制代码组成,虽有特定的媒体格式与数据结构,但并不完全独立,还能通过软件进行拆分、编辑和重组。这便体现了计算的开放性与软件的可扩展性。正如,我们常用的数字文档已不再是静态或平面的,还嵌入了动画或三维效果;一些读物能进行纸电声的网络联动……就此,马洛维奇描述说,“传统物理和电子媒介技术、再现格式,与计算机特有的新信息处理技术、数据格式,以新的组合形式被捆绑在了一起”。
计算机软件的扩展基于算法。我们熟知的“桌面”“文件”“文件夹”等就是通过算法进行扩展的结果,由此便具有了可检索、可分析和可视化的功能;数字文本的编辑也不仅在仿真传统书写,其内容生成与网络链接都普遍依赖计算;在图像编辑中,Photoshop通过算法预编程了水彩、油画、木刻等画笔,能自动渲染超预期的数字特效。致力于模拟工具和材料效果的算法,甚至还产生了一个重要后果,即随着参数变化,软件能计算生成完全陌生的内容。如在使用滤镜“波浪”时,滤波器的正弦波函数\(y=sinx\)的参数设置会使图像失真,让计算与现实世界的隐喻联系中断。
软件算法既能渲染数字特效,又被用于视图控制。在人机交互中,视图控制是一种通用的数字页面操控技术,赋能视图的切换、文本排序,并组织多级别的内容层次结构。软件中的“页面”“图层”等就是视图控制的常见模块,它们可以安置文本元素、存储数据信息,进而便于调整文本顺序、添加样式、控制透明度和可见性等。视图控制为数字内容的编辑增加了可视的纵横维度,并提供了文本链接与数字合成的技术条件,从而打破传统单一界面的固定模式,增强了内容编辑能力。
软件的算法扩展还体现在支持多人协作上。当前不少内容开发软件不仅无缝连接社交平台、数据库,还具有多人在线编辑和便捷的内容发布功能。腾讯文档就是一个支持在线创建、编辑和网络分享的多人协作式文字处理软件,它在我们的远程数字交往中发挥了不容忽视的作用。一些在线数字档案还通过谷歌地图的应用编程接口,来赋能世界各地的人们上传并读取数据信息。如乌多·诺尔\(Udo Noll\)和杰罗姆·乔伊\(Jérôme Joy\)发布的一个大型声音地图档案,就通过谷歌地图的应用编程接口\(API\),来赋能世界各地的人们上传并读取地方音景。
可见,软件的算法扩展赋能数字内容的生产。这一方面使软件的新模块、新功能、新插件得以不断研发与添加,新旧技术系统不断耦合;另一方面也增强了我们的内容编辑与合作能力,从而促成跨视图、跨平台与跨时空的读写实践,推进信息的沟通与交往互动。
(三)生成:模型涌现概率预测
马修·富勒\(Matthew Fuller\)提出,我们使用软件的读写行动存在着一个“临界点”。在这个点上,界面的解释性或结构性优势将随着计算机及其连接设备的突变能力而瓦解。而这已随AI内容生成软件\(集成了搜索技术、计算技术和学习技术\)的出现,成为现实。
生成式AI的运用突显了媒体内容从“生产”到“生成”的演变。在词源上,生成即“generate”,其词根“gene”指从父母转移到后代的遗传单位——基因,它决定了后代的某些自然特征。“generate”有导致、出现、形成和生产之意,如在数学中通过移动一个点、线或面来形成一条线、一个面或实体;或通过对词汇应用规则,产生一个有形式的句子。“generator”即生成器,意指具有某种转换、形成能力之物。就软件实践而言,生成式AI就是内容生成器,它通过提示词、参数、界面等来与人交互,实现了数字内容的一键式生成。
基于计算机诞生的控制论背景,本文所探讨的“生成”是指:人类的书写、读写经验作为程序自动生成的前提存在;在人机交互中,人类意图能够直接输入并转换为计算机的信息输出。由此,预设与生成是一对辩证统一体,即预设是生成的前提;生成是预设的结果;预设意味着计划与培育,具有相对的封闭性,而生成则体现为动态的开放,具有不确定性,它展现从一到多的自动演变过程,不排斥随机和偶然性。当然,生成并不独属于计算机程序,比如,传统书法实践基于长期训练,才能挥毫自如,让线条即时生成。其中线条生成的控制力量包括人\(决定方向、形态和表达\)、笔\(决定粗细、软硬\)和纸张\(决定渲染、质感\)。书法家的技艺与经验则保证了线条在不同作品中形成新的表达,且在不同时期实时生成。因此,传统书写是技术具身的行为,更是情感的流淌或意识的显化,其生成的线条具有生命力与创造力,难以测量。这与生成式AI的理性计算迥异。
生成也是计算机科学的概念。由于计算机的生成不是生命体的行动,其运行过程基于理性的时间分割与量化,因此其生成内容的过程是分步骤、可测量和可计算的。在图形学领域,生成即软件的算法生成,通常取决于所要生成对象的数学函数。算法生成如今已规模化应用于人工智能生成内容\(AIGC\),包括了文生文、文生图、文生视频、图生视频、视频生成其他视频等多模态应用。
AIGC的预设条件是社会技术系统配置的数据、算法和算力资源。其生成过程可简要概括为:模型接受海量数据输入,在充足算力的支持下,产生合理、有用和跨语境的算法输出。换句话说,AIGC以数据为基础,有赖于算法训练模型;海量数据能更好地进行训练,算力充足才能保障预测内容的涌现。就生成结果而言,由于AI模型的诞生源自科学发展史上的概率革命和统计革命,因此人工智能的算法生成基于世界的模糊性,放弃了准确性,而追求语言实践的“概率性”与跨情境运行的“生成性”。
控制论意义上的内容生成还离不开自我反馈与人类反馈。自我反馈旨以对抗的方式进行自我纠错,人类反馈则通过强化学习\(RLHF\)来提高生成内容的质量。如今,强化学习在模型训练中正发挥显著作用,主要是指编程者对AI模型进行“预训练”和“微调”。在此过程中,预训练帮助模型从数据学习,来掌握事实描述与对话能力,然后由训练员在一个更窄的数据集中对模型进行微调,通过强化微调准则,来规范AI模型对用户输入作出“合理”的概率预测。之外,人类反馈还包含用户交互行为中的自定义,用以提高生成内容的准确度。这样,AI模型就能深度学习人类的文明成果,并让生成的内容与人类常识、认知、价值等基本对齐。
可以看出,生成式AI通过模型训练、与人互动和强化学习来自动涌现概率性计算结果。由于AI模型既学习了已知的文明成果,又读取了大量人机交互数据,它们便能模仿人类读写,生成我们可理解的内容,并彰显其超越人的计算能力。不容忽视的是,虽然生成式AI具有自主性,但它们只有与人类智能深度交织,且不断满足人的读写需求,实现信息交换、数据可视与价值对齐,才能体现生机与活力。而且,生成式AI并非软件技术线性进化的结果,其涌现与可沟通能力的提升依然有赖于进一步的数字模拟和算法扩展。
通过梳理内容开发软件的进化历程,可知读写技术的演变经历了从数字模拟、算法扩展到概率预测,其中突显了人与软件技术的亲密接触、数字内容从“生产”到“生成”的变迁,以及新旧内容的延续、断裂与重构。这驱使我们进一步追问:在软件自主性逐渐增强的过程中,人与技术到底呈现了怎样的交融关系?接下来,本文将引入维贝克的赛博格意图理论,进行详细剖析。
三、赛博格的读写意图
维贝克认为,我们一直是赛博格\(即半机械人,一半是有机的,一半是技术的\),因此人与技术的关系不仅是唐·伊德\(Don Idle\)所言之中介、它者与背景关系,更是融合\(merge\)的。在他看来,赛博格的存在不仅超出了人与技术的关联和交互,还在物理层面改变了人及其文化实践。正如没有书写技术,我们的文化解释框架就会完全不同。
维贝克进一步指出,意向性\(intentionality\)是理解人与世界关系的核心概念,赛博格意图体现了人与技术的三重关系:当人的意图“通过”技术物件发生时,产生技术中介化的意向性;人的意图和技术意图之“叠加”,产生复合意向性;当技术与人“融合”时\(非相互作用\),就形成混合意向性。第一重赛博格意图是对伊德所言之技术中介化意图的继承;第二重推进了人与技术诠释、它者关系的研究;第三重则走出人本主义的藩篱,开启了从“人类技术\(anthropotechnologies\)”出发的探索。就此,维贝克指出人类使用的技术是构成不同“超人类\(transhumanist\)”的技术,应超越人文主义对人、人性与文本的关注,思考“人类技术”混合体及其行动。维贝克彻底地将人、技术与世界融合到了一起,这为本文探讨人与软件的交融提供了理论资源。
运用该理论,本文将数智时代人与软件技术的关系概括为中介、复合和混合。具体而言,当人使用软件时,技术中介化的意向性表明人的意图由计算机软件介导。人不会直接体验数字世界,而总是通过软件来塑造人与数字世界的特定关系。由此,“人—软件”的读写行动与体验由人类主导,软件会中介数据信息的读取与写入。毕竟,如果没有软件,人类就无法拥有具体的数字体验。复合意向性表明人与软件都具有行动者的意图,即当与人协作时,计算机软件作为它者也起着核心作用。“人+软件”的复合意向性也发生在伊德所言之人与技术的诠释关系中,涉及软件作为非人行动者对数字世界的算法生成,从而体现双重意图,即软件朝着它的世界行动;同时,人朝着软件意图的结果行动。赛博格的复合意向性具有软件增强人类智能和建设性意涵。混合意向性基于人技融合\(即半机械人\),是指在具身关系之前,软件与人实际上就是融合的,而不是被体现于身体。随着深度学习带来软件自主性的增强,赛博格的混合意向性便催生了“人/软件”智能体。
赛博格的读写意图表明人与软件的交融呈现多重面向。我们不能仅仅将软件视为中介,又或强调其作为它者存在,否则就会将我们的读写实践局限于软件的中介性或它异性上,导致人、技术与世界的分离。更为重要的是,随着当前AIGC领域人工智能与人类智能的深度交织,人与软件的边界模糊,尤其彰显出混合智能体的行动意图。因此,我们尤其应聚焦“人/软件”智能体的读写行动,来深入剖析组织媒体内容生成和涌现的新方式。接下来,本文将分别对中介、复合与混合的赛博格读写进行详细阐释。
四、赛博格的读写行动
(一)中介行动:单一媒体的数字化
赛博格读写首先体现为人与技术的中介关系,即人通过内容开发软件展开读写行动,软件介入、调节并形塑我们的媒体内容生产。而探讨软件如何影响我们的行动与体验,则有必要对传统书写技术及其中介化进行回溯。
早期人类的书写实践涉及使用纸、笔、墨等工具书写一个个空白页面,来探索文本编码的潜能及其可沟通性。正如约翰·杜海姆·彼得斯\(John Durham Peters\)所认为的,书写如“船”,使言语的海洋变得可通行。中世纪时,欧洲僧侣在手抄本上创造出多页面的垂直形式,从而革新了单一页面的空间结构。多页面在书籍演变中具有决定性意义,这是因为它用一系列界限分明且不连续的统一体,取代了卷轴这个均匀而连续的空间,将书籍塑造为了一个自足的整体;而且,由于书页数量增加,便于分离、查找和读取文本段落,使空间的信息容量也更大了。手抄本之后,人们凭借雕版和活字印刷术手工复制书籍。现代印刷术则通过机械复制进一步推动了书籍的空间生产、内容存储与信息传播。
如果说上述传统书写技术的中介化是近距离的,那么19世纪的现代技术带来的则是人的远距离书写,如采用光学装置显像,用声音刻录技术存储与播放唱片,以及通过信号传递电报信息等。远距离书写一方面表明摄影、留声机、电报的底层逻辑仍然是技术的中介化;另一方面则意味着现代技术革命带来了媒体内容生产的多样化与时空扩散——以光学装置、声音刻录和电报为代表的书写技术“打破了文字具有的所谓能指之垄断”,彰显出一种先进的人类操纵影像、声音和电磁信号传播的能力。
上述书写技术创造的都是具体且单一的媒体内容,而当计算机软件走进人类的读写实践中时,我们无疑便拥有了模拟上述传统技术与行为,用特定的算法整合、重塑其解释性结构的能力。具体而言,人们在界面上通过参数、菜单、对话框等可轻松操控一个个虚拟实体、文本时空及其动态链接的型构过程;反之,界面后台运行的算法也塑造着人的读写行动,让人在技术环境中直观体验到一件件数码实在物的创建与显现\(数字模拟中每一个工具、命令、菜单、参数运行都有一种单独的算法\)。软件的算法、界面在与人交互时也是媒体内容的解释者,它们通过投影其所渲染的虚拟实体,向人敞示与言说,也供人编辑、存储与读取。正如富勒研究Microsoft Word时所说,软件结合了自动化生产线、控制中心和安全系统,既保证了书写的流程及其稳态,又通过参数、菜单、对话框等对用户行为进行引导。正是算法的中介化让数字内容在屏幕上动态显现。
算法中介的行动不仅从物质技术中解放了媒体内容的生产,还为内容铭刻了一种特定的数据结构。在数字成像中,图像像素和矢量图形这两种数据结构,就替代了所有物质材料。马洛维奇就此指出,“如果效果以前是特定工具和材料之间相互作用的结果,那么现在它们是不同算法修改单个数据结构的结果……因此我们现在可以用单个软件来模拟不同媒体内容的创建、修改和组合,同时也能添加以前不存在的新技术,只要它们能在相同的数据结构上运行即可”\(14\)。可见,数据结构形塑数字媒体,让它们与传统媒体内容有了本质区别。
如今,轻松“上手”的内容开发软件凭借算法和数据结构在一定程度上已取代传统书写工具,成为赛博格读写的技术基底。这使我们更“自然”地接入数字生产的技术环境,从而更普遍地数字化媒体内容。而一旦文字、影像、三维等单一媒体都被铭刻上特定的数据结构,我们就不得不升级计算机的计算能力,以应对大规模数据化的挑战。
(二)复合行动:数据化与多媒体的共创
如果说技术中介化的读写行动基于人的意图,那么,“人+软件”的复合行动则突显出软件技术的自主性。在软件设计领域,软件自动化性能的提高有赖算法,算法由编程者设计,诸如Excel的列表计算、美图秀秀的图像计算、Google Scholar的文献检索等,都充分展现了算法能力的增强及其对日常生活与工作的渗透。可以说,正是算法的优化与自动计算能力决定并响应我们的上手行动,让读写过程更流畅、更稳定和高效。因此,大多数操作者虽然不知道算法的技术逻辑,但普遍依赖与之协作,来增强自身的数据处理能力。
算法是一个数据处理技术。彼得斯认为,早期人们用书写来计数和记账,后来才成为存储言语、记录法律或文学的载体。\(15\)可见,人的行为与思维是可计算的。计数行为早于数字,数字计量驱动了算法诞生,进而数据化特定的媒体内容。数据化\(datafication\)就是人脑运用算法将一种现象转变为可制表分析的量化形式过程。今天,我们与算法增强的数据处理技术协作,将原本对言语、面积、时间的制表计算,扩大到了对文字、影像、三维等内容的量化,从而体现了数据化万物、模拟世界的潜能。由此,数据化成为一种科学的内容生产范式。软件取代传统书写技术,成为协助人、掌管大规模量化、记录和计算过程的数据管理员。
人与软件的复合计算不仅数据化媒体内容,还能敞示新的媒体时空。在时间层面,随着计算能力的飞跃,软件算法能更高效地协助人完成计量和内容生产。比如通过输入具体材质、尺寸、光线和形态数据,软件就能预编程某种设计风格,并通过参数、菜单、对话框等引导我们的信息交互与内容编辑;不仅如此,不同的数字模块还能重组与拆分,实现文字、影像、三维等内容的非线性编辑。因此,与传统书写技术相比,算法能更好地与人一道管理线性与非线性相结合的数据信息流。之外,“人+软件”的复合计算还拓展了数字媒体的空间形态。比如数字文档既可分页、自定义大小,又能轻松与其他文档建立网络超链接;在各种图书阅听平台上,书籍图像被转化为了字、词、句和段落等文本数据,既便于计算机的信息处理,又拉近了人们的远程检索和读写;不少在线协作软件还通过互联网建立起云端的数据处理平台和资源库,以支持多人在线编辑和数据共享。由此可见,“人+软件”的复合计算能将信息从文本、意义及其载体中剥离出来,加速其数据化流通;同时,它也在字符与字符、字符与文档、文档与文档、人与数字媒体之间建立起数据信息交换的网络,以至于海量的数字媒体得以共创。
海量的数字媒体即“多媒体”。它继承了传统量化的基因,数据化多重媒体内容及其交叉与组合,能表征大量已知事实\(拉丁语中数据即已知、事实\),而这显然是传统书写工具难以大批量、同步且自动实现的。用马洛维奇的话来说,多媒体的诞生如同生物进化,不同的DNA组合产生了不同的“物种”。数字媒体的DNA无疑就是数据,数据的交叉与组合形塑了海量多媒体;由于数据纷繁,难以分辨准确或错误,因此数据组合与DNA组合一样,无法固守“物种”的精确度,只能承认多媒体内容的碎片、异质与混杂。
数据化不仅催生海量多媒体,还决定了媒体内容的分发权。随着数据规模变大、混杂增强、算法运行速度加快,内容如何分发就通常由人工智能软件来自动决策,而不再是人类。正如许多世界知名流媒体平台\(如奈飞\)都曾组织专业人士在图书、视频网站上进行推荐和评论,但自从采用人工智能软件分析数据与自动推荐之后,销售量就远远超过了专家推荐的贡献。为此,不少流媒体平台都放弃了成本更高的专家,而依赖大数据的算法推荐。显然,在这场机器完败人的竞争中,软件比人更有说服能力,其凭借算法在用户与内容之间建立起自动的个性化关联,从而掌管了内容分发权。作为一种弱人工智能,软件取代人会导致一个颠倒的结果——即软件将编程者、操作者作为中介,来获取计算运行的动力,从而动摇长久以来中介化读写实践和信息传播中人的主宰地位。
简言之,在“人+软件”的读写行动中,内容开发软件作为一名精通计算的行动者——包括数字计量、信息交换、数据组合和内容分发,与人协作且共创了海量多媒体。在此过程中,软件算法既建设性地增强人类智能,更在数据化、媒体杂交和定量分析中彰显出超越人的潜能。由此,弱人工智能会凭借大数据处理能力逐步进化为强人工智能。鉴于弱人工智能的存在基于人机交互,而“强人工智能可以看作是人机融合”,接下来,本文将进一步详细剖析人与强人工智能的混合行动。
\(三\)混合行动:型构数据驱动的超媒体
海量多媒体的泛在,为我们提出了一个生存性难题——即随着媒体内容的数据量递增,我们该如何在信息海洋中游弋?本文认为,只有与软件深度融合,我们才能凭借“人/软件”智能体的行动迎接这一挑战。如今,以ChatGPT、Midjourney、Sora等为代表的强人工智能不仅具有它异性,其神经网络还与人脑深度融合,形塑出人机混合智能体\(见图1\)。彼得·斯洛特迪克\(Peter Sloterdijk\)就此指出,“人机混合体正在成为一个由信息连接在一起的集成且可操作的系统。于是,我们才学会了新的读和写”。斯洛特迪克一方面指明人、技术和复杂信息系统的融合,另一方面也告诉我们信息系统不仅集成且可操作,还会重塑我们的读写实践。基于此,混合智能体的读写实践就是在一个复杂信息系统中的行动;作为控制论有机体,混合智能体与信息系统同构。而这一关乎生存的可操作方式则由数据驱动内容生成来实现。
图1 人机智能混合体(创
身处复杂的信息系统,编程者首先要标注数据。历史上,分类法和索引是最常用的数据检索方法,比如传统图书馆通过标注卡片来实现信息的分类和索引。基于小数据的卡片式分类和索引有效,但如果扩大数据规模,就可能无效。由此,数据标注成为当前分类、定位和索引海量数据的有效方法。然而,数据标注工作量巨大,不可避免会错标,因此无法保证准确性。这一方面表明媒体环境错综复杂,另一方面则告诉我们,“只有当标注数据足够多、放弃数据的准确性时,我们才可能获得多样的可能性”。
数据标注的现实促使非关系型数据库诞生——它无需预先设定复杂结构,就能提供读写、处理和存储超大规模的数据资源。这样的存储方式不可避免地去掉了数据的关系性,但也增强了数据可扩展的能力。因此,与传统数据库不同,非关系型数据库不会向人提供唯一答案,而是随着数据量与交互的大幅增加,不断地涌现解决方案。舍恩伯格就此认为我们不得不在数据缺陷和效率之间做出选择,“宽容错误会给我们带来更多价值”。正如许多翻译软件的语料库数据都来自未经过滤的网页内容,其中包含着各种各样的错误,也没有人工纠错,但正因此它们才成为合格的“翻译官”。毕竟,只有强调数据完整、接受它的混乱性和不确定性,才可能不断接近事实的真相。于是,互联网\(拥有95%非结构化数据和5%结构化数据、数据量约三年翻一番\)就理所当然地成了编程者训练大模型的主流数据库。
如果说编程者在信息系统中作为大模型的“伺服”存在,那么操作者的“投喂”在内容生成中同样不容忽视。由于大模型的概率预测有赖于人类反馈,因此操作者及其投喂可被视为促成程序一键式生成的中介。这种简化的操作模式会将原本主动的操作者转变为弗卢塞尔所言之装置的“功能执行者”。毕竟,大模型也需要操作者提供能量,并在算法生成的合理性和速度方面配合程序的自动运行。换句话说,表面上看是操作者在生成式AI的界面上点击生成媒体内容,但实际上混合行动中大模型通过操作者的主动投喂,彰显出自动涌现的能力且形塑了混合体的黏性。
通过数据标注、数据投喂和模型训练,混合智能体便能凭借一种自动机制计算生成概率文本。概率文本不同于单一媒体与多媒体,其生成动力来自数据,取决于由数据节点、链路和网络组成的一种非线性组织。在数据驱动下,概率文本能自动链接与追踪离散的数据节点,并组成包括文字、影像、三维等多媒体内容的复杂信息网络。而且,由于媒体杂交在数字环境中非常普遍,因此通过数据节点建立各种变体的非线性关联就显得至关重要——即在数据驱动下形塑导航链,将多媒体内容的相关数据节点连成导航图,来导引概率文本的涌现。
数据驱动的导航链分为实链与虚链。实链运行时数据节点直接连接且信息不会改变;而虚链则是在运行中经过程序化计算连接而成。由于概率文本的网络关系是多对多的,因此,计算生成的虚链能为我们提供目标不确定的信息,也可以在目标数据节点无法被访问时提供随机替代,连接与之有关的其他链路。实链与虚链并非对立,而是交织在复杂的数据导航之中。如果我们将实链看成基于人价值“算计”的有限数据节点之间确定的关系网络,那么,可导航的虚链就是模糊“计算”的结果。虚实导航链的交织无疑体现了算计与计算的密不可分——计算的过程中需要算计来指引方向,算计的过程中也需要用计算来完成基础性工作。二者缺一不可,只有二者结合才能实现更好的智能。由此可见,数据驱动的概率文本涌现虽是可预测的,但具有不确定性,因为数据“看似客观、精确和可复制,却可以用来讲述各种各样的故事”。数据可视化甚至会让事情变糟,正如我们在畅想强人工智能会颠覆人的创造性实践时,发现其并不可靠,经常出现推理和事实上的错误,一些计算结果甚至背离常识。
混合智能体处理非线性数据关联、涌现概率文本的巨大潜能,形塑出一个能自动运行的复杂信息系统——“超媒体\(hypermediacy\)”。ChatGPT、Midjourney、Sora等就是当下的典型代表,它们不仅吸纳人类的劳动、知识和经验,还像“云”一样不断地交叉、组合与变幻……这无疑改变了我们的读写实践且重塑了信息传播的自动机制。在此意义上,超媒体是一个容器,承载着赛博格的数据存储、标注、训练与投喂等行动;超媒体也是一个无边界且动态运行的网络化系统,由异质性媒体内容组合而成,没有物理意义上的开始、中间和结束,且依赖数据驱动信息的关联、组合与流动;超媒体更是一个控制论意义上的有机组织,它用数据驱动信息输入、链路计算与内容涌现,营造出深度杂交的媒体生态环境。对于信息传播而言,深度杂交意味着过去、现在和未来的媒体内容都融入其中,它们会混合、杂交与变异,进而塑造信息幻象。
五、结论与反思
数智时代的“赛博格读写”体现人与内容开发软件的三重交融。通过详细剖析中介、复合和混合的赛博格读写,本文揭示媒体内容创生过程中人与软件的多重关系向度,尤其突显当前人工智能与人类智能交织的现实,并指明赛博格的混合读写营造出深度杂交的媒体生态环境,从而为数智时代的信息传播提供“无限”可能。然而,我们却不得不因“无限”而与一个悖论难题纠缠搏斗。这是因为,基于大数据信念的“无限”或许只是一个信息涌现的幻象,它恰恰反映了我们的“有限”认知——即超媒体生成的海量内容基于有限数据的统计,且是一个个算计和计算耦合的关联性结果。
更为严峻的危机是:如果数据被人为有目的地训练、诱导、删减与微调,那么无限关联还会滋生知识操控与信息传播的风险,导致我们只知道“是什么”,而无视“为什么”。在知识操控层面,随着强人工智能不断发展,技术会重新定义言传知识,将它退化为一种技术施展的“魔法”。毕竟言传知识建立在对信息的提炼、归纳和逻辑推理之上,而秉持数据主义的技术专家则相信它由纯粹的相关性决定,如果拥有足够多的数据和分析能力,就能塑造知识权威。在信息传播层面,赛博格的混合行动会形塑一种数据驱动的传播新生态。一方面垃圾信息的生产永不停息且泛滥,会不可避免地导致交往沟通的困境;另一方面则会带来严峻的信息操控危机——即数字巨头凭借超媒体引导社会公众舆论,操控人的行为。因此,我们须要批判其中的“数据主义”\(dadaism\)意识。
当前,在社会、研究和商业的交叉点上,数据化正扮演深刻的意识形态角色。这使得我们生活的现实通过数据实现了客观化\(objectivization\),事实通过算法则达成了主观化\(subjectivization\)。数据主义者甚至认为,生命体本身也是一种算法,可被简化为一组数据,且能通过编程算法进行重组,以寻求理想的结果。于是,大数据和算法作为一个新的“神话”,成为这个时代所有答案的最高权威来源。这导致我们普遍相信大数据所谓的客观、中立和革命性,且自愿地信仰它,进而深陷在各种人工智能竞赛、宣传云和云之战中。因此,如何消除盲目的数据崇拜,来对抗谎言与扭曲,抵御冗余和虚无的信息幻象,就显得尤为迫切。诗人艾略特\(T.S.Eliot\)曾说:“到哪里去找回我们在信息中丢失的知识,到哪里去找回我们在知识中丢失的智慧?”——这无疑是一条艰难之路。
杜丹,苏州大学传媒学院副教授。
全文载《现代传播(中国传媒大学学报)》2024年第5期,参考文献从略,引用请参考原文。
本文转自 | 数字交往