大家好,今天继续聊聊科技圈发生的那些事。
据北京市朝阳法院的官方公众号消息,涉导航电子地图“拥堵延时指数”数据权益不正当竞争纠纷案在北京市朝阳区人民法院公开审理。
朝阳法院一审认定被告某信息技术股份有限公司构成不正当竞争,判决该公司停止侵权、消除影响,并赔偿原告北京某科技有限公司、某软件有限公司各项损失共计 1250 万元。
事情是这样的,某信息技术公司在未经授权的情况下非法抓取了高德地图“拥堵延时指数”的数据。这个数据代表居民出行实际时间与自由流速度状态下的时间平均比值。简单来说,就是看堵不堵车的。
该公司抓取了拥堵延时指数后,将抓取的数据存储在某金融终端软件中,以商业目的向付费用户传播,以此牟取经济利益。
朝阳法院经审理认为:
这种行为违背了数据领域中公认的商业道德和诚实信用原则,损害了原告公司的合法权益及消费者利益,破坏了数据领域中的市场竞争秩序,构成不正当竞争。
后来据相关媒体报道得知:
可灵(Kling)是一款视频生成模型。最近在网上的热度很高,效果很强!
提示词:一个男人骑着马在戈壁沙漠飞奔,背后美丽的夕阳,电影级别画面
相信说到视频生成模型,咱们最先想到的应该还是 Sora。Sora 的小狗、都市女性在网上疯传了一段时间,可大家却一直没法真实得体验到。这次可灵一来就是大暴击,没有吊人胃口的 demo 和预发布内容,直接就是开放测试!
提示词:一个戴眼镜的中国男孩在快餐店内闭眼享受美味的芝士汉堡
不难推测,Sora 用的训练集大多是欧美那边的,而快手肯定是就近取材了。可以发现根据训练集的不同,可灵生成出来的视频相较于 Sora,明显更符合咱国人的胃口。比如车牌的底色是蓝色,与国内相符;人物的长相符合国人特点;生成的视频如果和吃饭相关,会使用筷子。
提示词:一个中国男人坐在桌前,用筷子吃面条
此外,可灵还有一个视频续写的功能。给出一段视频,它可以帮你往后【+5s】,续写一小段。经过实测,最多可以续写三分钟左右。
续写x1: 女孩抬起手触碰到帽檐
续写x2: 女孩放下手,看向远方
怎么样,这个效果确实还不错吧!可灵采用了 3D 时空联合注意力机制,使得新生成的片段并没有像 Sora 一样出现一些反物理现象,能符合运动规律。
网友评论道,可灵生成的视频的确不像 Sora 那样有很高级的滤镜感,一眼给人很惊艳的感觉,但生成的视频明显更贴近生活,真实了很多。
目前可灵主打的功能就是图/文生视频,以及视频续写。需要注意的是,这个模型现在申请使用的人比较多,可能需要排队。感兴趣的小伙伴可以耐心等待一下。
体验地址:
前不久,微软开源了 Florence-2。这是一款适用于各种计算机视觉和视觉语言任务的模型。
我们能接触到的视觉方面的大模型在迁移学习方面表现出色,但通常专注于某一项任务,很难通过给出简单的指令完成不一样的任务。Florence-2 这款模型最厉害的点就在于,它可以通过 task prompt 给出任务指令,包括但不限于字幕、物体检测、文字识别等。
模型采用自动图像注释和模型完善的迭代策略,其中包括 1.26 亿张图像上的 54 亿个综合视觉注释。因此,Florence-2可以执行多功能综合视觉任务。
比如在下面这张图上我们给出的prompt选择了Object Detection 目标检测,可以看到,模型检测到了图上的各个部分。
目前,模型的 prompt task 可输入,但也做了选择框,里面基本涵盖了大部分主流的计算机视觉任务。
模型内容还在持续更新,感兴趣的小伙伴可以持续关注一下。
项目地址:
https://github.com/retkowsky/florence-2
在线体验地址:
https://huggingface.co/spaces/gokaygokay/Florence-2
好了,本期的内容就是这么多,我们下期再见!