大发注册_大发注册
大发注册2024-01-19

大发注册

向善而生的AI助盲,让AI多一点,障碍少一点******

  有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。

  AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。

  新契机:多模态算法或将造福数以亿计失明者

  科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。

  一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。

  多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。

  大挑战:如何看到盲人“眼中”的千人千面

  AI助盲看似简单,但多模态算法依然面临重大挑战。

  多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。

  但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。

  另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。

  为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。

  另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。

  最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。

  多解法:浪潮信息AI助盲靶向消灭痛点

  AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。

  在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。

  盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。

  目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。

  真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。

  在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。

  眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。

刑满释放人员成“励志网红” 到底励了谁的志?******

  挤入流量新赛道 刑满释放人员成“励志网红” 到底励了谁的志?

  主播王某(化名)把自己的《释放证明书》贴在朋友圈封面上,上面写着他的户籍所在地、犯罪事由和服刑时间。不知从何时起,打开抖音、快手搜索“刑满释放”,便会看到许多自述刑满释放的博主,用短视频或者直播进行分享和创作。

  一个新流量赛道悄然出现,运营个人账号的刑满释放人员们共同踩出一条“浪子回头励志网红”的新赛道。

  然而,这样的“励志网红”也问题不断。近日,小红书平台账号“天郎哥哥”晒出自己的《释放证明书》并写道“我不会接受别人对我的施舍……重获新生……希望大家关注我”,得到很多网友支持。但很快,有网友发现并曝光其所犯罪行为强迫卖淫罪。该账号也很快搜索不到。

  刑满释放人员当主播

  有何乱象

  有人过往罪行被曝光账号被关闭

  上述小红书“天郎哥哥”被曝光其所犯罪行为强迫卖淫罪后,网友纷纷表表示其“不配重新开始”并获得支持和关注,认为“这样的人如果可以做励志网红,真是荒诞至极、令人愤怒”。

  与此同时,在微博拥有账号的“寻亲男孩今晚有没有哭”的主播,自述悲惨寻亲经历,称命运坎坷曾误入歧途,进入“社会大学”(即监狱),收获不少同情。在抖音上吸引了12余万粉丝后,“寻亲男孩今晚有没有哭”开始直播带货,用偏贵的定价向女性粉丝卖卫生巾,却被发现、曝光其所犯罪行是强奸罪——他曾持刀强奸不到15岁的女性受害人。消息曝光后,群情激愤,众怒难消,网友纷纷表示“愤怒至极”“不可容忍”。

  截至发稿时,记者在两个平台上均已搜索不到上述账号。但如果在多个短视频平台搜索“刑满释放”,会有大量刑满释放人员经营账号跃入眼帘。

  有人称没有收入要“养家糊口”

  主播成某(化名)的直播往往开始得早,将近凌晨2点才会结束。成某告诉记者,这是一份有付出就有回报的工作,而他现在能找到的其他工作“收入和回报都不成正比”。

  事实上,自从有粉丝在直播间告诉王某,某抖音账号主播的刑满释放人员身份是假的,浪子回头是其假人设之后,王某就把自己的《释放证明书》贴了出来。

  主播王某曾因侵犯公民个人信息罪获刑,他告诉记者,他做视频账号,因为不吐不快。“一是为了发泄自己心里的压抑,二是希望别人看到我的事情之后能够遵纪守法,这是我的初衷,监狱里面的生活真是太难了。“

  被问及在账号中直播带货是否抱有赚钱的目的,王某是这样回答的:“我现在没有收入,粉丝告诉我可以挂小黄车,别人可以买东西,我肯定不排斥赚钱的机会,就挂了。但也没有为此去讲解商品,我连那些商品都没有。”

  成某告诉记者,经营账号全为“养家糊口”,其直播打赏和带货收入有限且不稳定,但“好的时候要比我们这个县城的平均收入高”。

  出狱后缺乏一技之长,工作难找

  王某告诉记者,出狱后,像开网约车、送快递、送外卖这样的好工作,他都找不到。

  同为“刑满释放”主播的成某则对记者表示,刑满释放人员大多学历较低且缺少一技之长,在网约车司机等职业将其拒之门外时,最理想的去处是不需要提供无犯罪记录证明的小企业。

  “刑满释放”主播王某和成某都表示自己没有签约公司。成某告诉记者,他曾经短暂加入过“工会”——一个帮忙进行策划和推流的组织,需要分成30%左右。“但是我这个类型太冷门了,很多内容他们都不知道,帮不上忙,没多久我就退了。”

  成某表示,经历了近10年的服刑,他并非利用刑满释放这一身份,而是因为这是他唯一的创作源泉、了解的内容。在作为刑满释放人员分享之外,成某也曾尝试运营过亲情有关的内容,但反馈平平。2023年1月12日,成某在自己的账号上发布新视频,表示尽管运营视频账号带来了一定的收入,成某还是希望年后去找一份别的工作,如果工作不顺,接下来就要专心做账号。

  是谁在关注他们?

  记者观看直播、参与粉丝群聊发现,在刑满释放博主的直播间,有大量服刑人员家属问问题、和主播互动并打赏,他们有许多无法从其他渠道解决的困惑,比如该给服刑人员打多少钱,送什么样的衣服是他们需要的。

  主播成某在赌场做“小弟”而后因经济犯罪入狱9年有余。一个关注者问成某:“(在服刑的亲友)总说让我不要去,麻烦,我该不该去?”成某回答说:“能去就去,那么说是怕你折腾、怕你花钱、怕你费事,心里肯定是希望你去看他的。”

  争论

  抛开公平与否,只说社会影响,刑满释放人员很可能会因为无法生活而变成一个更严重的罪犯、走上极端,社会应该对这种犯过罪的人有一定的包容性。

  互联网营销师现在正在全面培训并颁发相关资格,以后需要培训和持证上岗。如果不允许有犯罪记录者进入这一行业,对用户价值观的传递和保护将起到一个重要作用。如果有MCN公司以此为流量口,用“刑满释放”做流量去带货,价值观是不对的。

  刑满释放人员可当“励志网红”吗?

  刑满释放人员可当“励志网红”吗?对此,不同专家说法并不统一。

  北京市大禹律师事务所陈嘉伟律师对此表示,抛开公平与否,只说社会影响,刑满释放人员很可能会因为无法生活而变成一个更严重的罪犯、走上极端,社会应该对这种犯过罪的人有一定的包容性。

  中国政法大学传播法研究中心副主任朱巍则告诉记者,主播是一个出现在公共领域中的社会形象,其代表的不仅是一个职业,往往更是需要粉丝和打造人设来进行对外表演的特殊职业。

  2022年4月,国家广播电视总局网络视听节目管理司、中共中央宣传部出版局发布《关于加强网络视听节目平台游戏直播管理的通知》。通知提到,一段时间以来,网络直播乱象、青少年沉迷游戏等问题引起社会广泛关注,亟需采取有力措施予以严格规范。通知要求,严禁违法失德人员利用直播发声出镜。网络直播平台在主播和嘉宾选用上要严格把关,坚持把政治素养、道德品行、艺术水准、社会评价作为选用标准。对政治立场不正确、违反法律法规、违背公序良俗的失德失范人员坚决不用。

  朱巍表示,“现在对一些公众人物,比如说明星偷逃税、存在私德问题都要予以禁封,那么对网红来讲怎么能出现这种情况?还是要把底线给划好。”

  2020年7月6日,人力资源和社会保障部、国家市场监督管理总局、国家统计局联合发布11个新职业,其中互联网营销师下面的“直播销售员”工种成为本次颁布的国家新职业,并纳入《中华人民共和国职业分类大典》,引发关注。

  “互联网营销师现在正在全面培训并颁发相关资格,以后需要培训和持证上岗。如果不允许有犯罪记录者进入这一行业,对用户价值观的传递和保护将起到一个重要作用。如果有MCN公司以此为流量口,用‘刑满释放’做流量去带货,价值观是不对的。”朱巍这样说。

  北京市中闻律师事务所邓千秋律师则表示,仅仅因为相关人员以“刑满释放”的标签博眼球而施予红包、打赏等,“公序良俗”原则可能成为认定此种情况下的打赏、发红包等赠予行为无效的理由,但需要具体、成熟的司法实践予以明确,目前还没有见到相关的判例。

  而陈嘉伟律师提出,在上述引起网友愤怒的两个案例中,刑满释放人员均是强迫卖淫、强奸等不被社会包容的犯罪事由,有具体的受害者和真切的伤害。

  陈嘉伟律师表示,如果刑满释放的强奸犯在直播中暴露被害人的相关个人信息,或者其他损害到被害人名誉的言论、行为,博取流量,被害人可以通过民事诉讼要求赔偿、停止侵权行为,如果是有公司策划运营,可要求其承担连带责任。如果在自媒体、直播中还有其他严重侮辱被害人、贬低被害人人格的行为,被害人可以“侮辱罪”提起刑事诉讼。

  “针对强奸罪,刑罚是没有剥夺政治权利的。但是如果再犯侮辱罪,侮辱罪的刑罚是可以判处剥夺政治权利的附加刑,那么刑满释放后在附加刑期限内,犯罪人是没有言论自由的。”

  互联网审核业内人士:

  利用犯罪事实等进行炒作、消费的行为,都属于平台严厉禁止,比如穿囚服直播、讲解监狱内容信息、讲述犯罪过程等行为,都在平台的规则覆盖之内。

  专家:直播从业者需重视价值观导向

  朱巍对记者表示,“但现在有几十个职业确实是不允许有犯罪记录的人从事,这也是法律的规定。直播相关从业并没有明确的法律规定,但重视价值观导向。在导向问题上,如果把刑满释放作为一个流量口吸引大家,这肯定有问题。”

  记者检索发现,公务员、法官、检察官、法院书记员、人民银行行员、新闻记者、校车驾驶员等职业,针对所有犯罪终身不得从事。而直销员、导游、出租汽车驾驶员、网络预约出租汽车驾驶员等职业,则是针对特定犯罪(刑罚)终生不能从事。

  一位互联网审核业内人士对记者透露,利用犯罪事实等进行炒作、消费的行为,都属于平台严厉禁止,比如穿囚服直播、讲解监狱内容信息、讲述犯罪过程等行为,都在平台的规则覆盖之内。

  成都商报-红星新闻记者 王辰元 张炎良

中国网客户端

国家重点新闻网站,9语种权威发布

大发注册地图