微软ai语音合成网站(vivo手机是有两个语音助手吗)
本文由世外云(www.shiwaiyun.com)小编为大家整理,本文主要介绍了vivo手机是有两个语音助手相关知识,希望对你有一定的参考价值和帮助,记得关注和收藏网址哦!
1、vivo手机是有两个语音助手吗?
谢谢你的邀请,。vivo 现在的手机很智能。之前因为新系统的原因,人工智能无疑提升的非常好,召唤萧冰还可以直接进行天气查询,索要地图和路线,聊天等功能,方便了生活,也是无聊时消磨时间的好伙伴。据了解,微软和vivo团队计划在未来开发更深层次的技术能力,定期引入更多技能,为用户提供领先的人工智能产品体验。可以说目前的召唤萧冰只是冰山一角,所以我也期待vivo未来更多的创新。综上所述我很满意。近年来,得益于计算机硬件性能的突破和
2、谷歌微软如何提前将专利写成了IP行业楷模?
云计算为代表的计算技术的快速发展,人工智能技术发展迅速,人工智能的研究和应用掀起了新的。目前人工智能领域已经覆盖智能客服、商业智能等服务器,以及视觉识别、机器学习等技术层。越来越重视人工智能领域的知识产权保护。人工智能领域的专利申请可能不仅因为方案本身的新颖性和创造性而被驳回,还可能因为专利法第2条第2款、第26条第3款和第26条第4款而被驳回。
基于此,写作中涉及的以下问题值得思考:
1.是发明的对象吗?
人工智能领域的很多专利申请都涉及到公式和算法的改进。涉及公式和算法改进的发明专利申请如何符合专利法第二条第二款的规定?
2.说明是否完全公开?
对于应用人工智能的专利申请,说明书中对算法的描述应该公开到什么程度?
3.索赔清楚吗?
假设模型用于实现某种测试并输出最终数据,那么测试过程是否应该在权利要求中定义?
基于以上三点考虑,本文研究了谷歌和微软近年来在人工智能领域的专利申请,分析了该领域专利申请的权利要求的发明对象、说明书充分公开、保护范围明确等问题。
01
客体问题
对不符合《审查指南》第二章第一章专利法第二条第二款规定的对象描述如下:
专利法所称发明,是指对产品、方法或者其改进所提出的新的技术方案。技术方案是利用自然规律解决技术问题的技术手段的集合。技术手段通常由技术特征来体现。不使用技术手段解决技术问题以获得符合自然规律的技术效果的方案,不属于专利法第二条第二款规定的客体。
根据审查指南,技术方案应具备三个要素:技术手段、技术问题和技术效果。
至于权利要求是否构成技术方案,审查员1从以下三点考虑:
(1)权利要求中是否有技术特征,如果没有技术特征,没有采用技术手段,不属于技术方案;
(2)如果有技术特征,判断这些技术特征能否对所要解决的问题和所要达到的效果发挥作用;
(3)判断要解决的问题和要达到的效果是否属于技术问题和技术效果。
根据指南,技术手段是指利用自然规律的手段。但是,除了永动机可以明确排除外,判断一种手段是否利用自然规律似乎很难。
但在人工智能领域,权利要求中可能会记载一些算法或公式,这也引起了一些算法和公式是否属于技术手段的争议。在我看来,算法和公式是否属于技术手段可以 不能只看算法和公式本身,而要看算法和公式是否能与具体的技术领域相结合,或者算法中的变量是否能与具体的物理意义相结合。
下面,用具体的例子来分析本发明的目的。
两个案例
01
案例一:CN108351984A涉及一种硬件效率高的深度卷积神经网络。其方法的独立权利要求是:
12.一种方法,包括:
接收输入图像;
生成输入图像的频域表示;
在包括多个卷积层和至少一个全连接层的深度卷积神经网络中,至少部分基于输入图像的频域表示和卷积加权核的稀疏频域表示来提取多个特征,其中卷积加权核的稀疏频域表示包括密集矩阵和一个或多个稀疏矩阵;
基于提取的特征对输入图像进行分类;以及基于该分类将输入图像识别为包含感兴趣的对象。
根据上述三要素,判断该权利要求要求保护的方案是否为技术方案,具体为:
第一步是有没有技术特点。显然,它具有技术特征,因为在接收输入图像并生成输入图像的频域表示后,对图像的频域表示进行后续的卷积运算,所以权利要求中的特征仅限于图像处理领域,频域表示和卷积都结合了图像的物理意义(例如图像数据)。因此,该权利要求包含技术特征。第二步,判断这些技术特征是否能对要解决的问题和要达到的效果起到作用。本申请的背景指出:
虽然与更有限的基于建模的机器学习方法相比,卷积神经网络表现良好,但卷积神经网络在硬件中的实现导致了高能量和计算复杂性成本。例如,卷积层通常涉及高计算复杂度,全连接层通常涉及高存储器存储成本。这些因素尤其阻碍了卷积神经网络在诸如可穿戴设备和移动设备等功率受限设备中的实现。
可以看出,该应用旨在要解决的问题是卷积层的计算过于复杂,导致神经网络的硬件要求很高。
解决该问题的方法的独立权利要求的技术特征是:生成输入图像的频域表示;在包括多个卷积层和至少一个全连接层的深度卷积神经网络中,至少部分基于输入图像的频域表示和卷积加权核的稀疏频域表示来提取多个特征,其中卷积加权核的稀疏频域表示包括密集矩阵和一个或多个稀疏矩阵。
这个特征的技术效果是在卷积层中执行的卷积加权是在傅立叶(频率)域中执行的。时域卷积可以转化为频域乘法,降低了卷积加权的复杂度,提高了设备的处理速度,降低了功耗。
因此,该方法的独立权利要求中的技术特征对于所要解决的问题和所要达到的效果具有积极的作用。
第三步,判断要解决的问题和要达到的效果是不是技术问题和技术效果。第二步确定的问题是卷积层的计算过于复杂,导致神经网络的硬件要求很高。很明显,和具体的技术领域(设备的硬件设置)结合起来就是技术问题了。因此,在方法权利要求中,CN108351984A可以将算法与实际的图像处理相结合,而不是只记录算法的改进,这样权利要求的特征就可以与实际的图像相结合,而不仅仅是算法本身,这样记录的特征就是技术特征。另外,在本申请的背景技术中,算法的复杂度被放在了设备的硬件成本上,这样要解决的问题就是技术问题。此外,说明书中记录的效果与处理器的处理速度和功耗相对应,因此整体方案可以解决硬件通过卷积神经网络处理图像速度慢且对硬件设置要求过高的技术问题,从而确保整体方案属于本发明的目的。
同时,CN108351984A在说明书中花费了大量的时间来记录方法权利要求中的每一步是如何通过硬件实现的,并且方法中的步骤可以与具体的硬件环境相结合,这也说明了方法中的特征可以通过硬件来实现,各种硬件设备之间的交互必须利用自然规律(例如数据传输过程中的电信号),这也为方法的发明对象提供了修改的空间。
CN109196582A涉及一种由一个或多个计算机执行的方法,包括:
由一个或多个计算机确定指示单词拼写的拼写数据;
由所述一个或多个计算机将所述拼写数据作为输入提供给经训练的递归神经网络,所述经训练的递归神经网络被训练为至少基于指示单词拼写的数据来指示单词发音的特征;
响应于提供拼写数据作为输入,由一个或多个计算机接收由经训练的递归神经网络生成的指令表单词发音的重音模式的输出;
由所述一个或多个计算机使用经训练的递归神经网络的输出来生成指示单词发音的重音模式的发音数据;
以及通过一个或多个计算机将发音数据提供给文本到语音系统或自动语音识别系统。
人工专利的核心是机器学习算法,而这些算法或计算机程序很多都体现在数学模型中,比如神经网络模型。不同国家对人工智能专利申请的对象有不同的要求。比如和日本,网络模型本身的改进也是可以授权的。
基于上述《考试指南》规定的客体三要素,对案例2方案的分析表明,案例2方案符合《考试指南》规定的客体三要素,即案例2方案包括技术特征,如:1 "用于确定所指示单词拼写的拼写数据 "和 "递归神经网络接收来自一个或多个计算机的指令,并响应于提供拼写数据作为输入进行训练;"由所述一个或多个计算机使用所训练的递归神经网络的输出来生成指示单词发音的重音模式的发音数据。
第二,所包括的技术特征对要解决的技术问题有影响。根据案件的背景, "一些ASR和TTS系统可以使用手动规划的发音词典。字典中的条目可以包括音素序列,例如 "foo "→/f u/(in X-Sampa(扩展音标)) "。可见,要解决的技术问题是实现基于拼写数据自动输出发音数据的效果。显然,以上确定的技术特征对于实现基于拼写数据自动输出发音数据的效果具有积极作用。
再者,也可以明确,要解决的技术问题和要达到的效果也是技术问题和技术效果。因此,本案应当符合我国的发明客体。
但在欧洲或美国,纯算法改进可能会出现对象问题。尤其是美国对计算机程序的审查更为严格。在美国,审查员在判断适当的专利客体时采用两步检验法。在两步测试中,如果抽象概念(例如,模型、算法等。)都参与了理赔,很可能是有对象问题。检索资料后发现,案例2的美国申请确实遇到了美国101审查意见,即不符合申请对象的审查意见。
图1-1
如上图1-1所示,本案权利要求1所要求保护的方案被审查员认定为不符合申请目的,但是是审查员对权利要求5给出了有希望授权的指示。让 ■对比本案的权利要求5和权利要求1:
权利要求1是:
1.一种由一台或多台计算机执行的方法,即comprising:方法
由一个或多个计算机确定指示单词拼写的拼写数据;
由所述一个或多个计算机将所述拼写数据作为输入提供给经训练的递归神经网络,所述经训练的递归神经网络被训练成至少基于指示单词拼写的数据来指示单词发音的特征;
响应于提供拼写数据作为输入,由所述一个或多个计算机接收指示由所述经训练的递归神经网络生成的单词发音的重音模式的输出;
由一个或多个计算机使用训练的递归神经网络的输出来产生指示单词发音的重音模式的发音数据;和
由一个或多个计算机向文本到语音系统或自动语音系统提供发音数据hr:的至少一个重音位置的发音数据
由一个或多个计算机将拼写数据作为输入提供给经训练的递归神经网络,包括将拼写数据和发音数据作为输入提供给经训练的递归神经网络;和
接收由经训练的递归神经网络生成的指示单词发音的重音模式的输出包括接收由经训练的递归神经网络响应于提供拼写数据和发音数据作为输入而生成的指示单词发音的重音模式的输出。
对比权利要求1和权利要求5,可以发现权利要求5中对技术特征的非抽象和具体描述要比权利要求1多,例如上面权利要求5中的下划线部分。
那么我们可以得出结论,在撰写与算法或模型等抽象内容相关的权利的过程中,可以引入更多的具体技术手段的描述,在描述技术效果的过程中,需要强调具体技术特征的贡献。也就是说,在描述权利要求如何解决技术问题时,可以强调权利要求中的技术特征比所包含的抽象概念更有助于解决技术问题。
总结
存在在撰写人工智能领域的权利要求时,要将一些算法应用于某一技术领域,并结合实际的物理意义。比如获取待处理的图像数据,根据一系列AI算法获取处理后的图像数据。记住不仅仅是描述算法的改进,就是需要结合实际的应用场景。
在撰写权利要求书的过程中,我们可以根据不同国家的对象确定的差异来布局从属关系。例如,在独立权利要求1更多的是关于算法或模型等抽象内容的描述的情况下,从属关系可以布局更详细的技术特征,或者我们可以布局关于算法或模型等抽象内容如何与实际硬件环境相结合的从属关系。此外,当描述权利要求如何解决技术问题时,可以强调权利要求中的技术特征比所包括的抽象概率更有助于解决技术问题。
3、微软与BBC联合打造的Beeb语音助手有何特点?
英国广播公司(BBC)与微软合作,推出了早些时候宣布的早期版本Beeb语音助手。感兴趣的朋友可以注册成为Windows Insider测试人员,下载测试版体验。需要指出的是,目前这项服务仅在英国开始有限的测试。
BBC去年宣布了Beeb语音助手项目,但它并不打算成为亚马逊Echo硬件的简单替代,而是在自己的产品中内置语音服务(包括网站和iPlayer电视流媒体服务)。
(来自:BBC/微软)
虽然只有英国的Windows Insider测试人员有机会在Windows 10 PC/平板电脑问它,但Beeb Beta版现在已经可以在英国下载,任何人都可以轻松注册成为Windows Insider测试人员。
起初,Beeb只支持通过语音控制播放特定的BBC节目,如 "好吧Beeb,播放电台1 "。但是,用户也可以要求刷新内容并获取当地的天气信息,并要求Beeb讲一个笑话。
在个性化方面,第一个测试版只支持男声,但BCC希望未来能为用户提供更丰富的音源选择。
4、大家在剪辑影视娱乐视频都用什么软件?
在,每个人都制作视频短片,因为在不同的条件下方有所不同。手机编辑:
1.可以用非常流行的编辑软件对:进行编辑、评分和过滤。可以说它的功能应该是独一无二的。更重要的是操作方便。
2.快片:快片其实是一个比较方便的剪辑软件。如果您需要为视频添加字幕,Fast Film可以一键添加字幕。他可以根据一段视频中的声音自动为我们添加字幕,也很方便。
电流大脑编辑
1.pr:如果用电脑来编辑视频,可以说pr是最简单方便,功能齐全的软件。可以实现各种画面效果,也可以作为视频版ps使用。
2.声音和阴影:是一个相当不错的视频编辑软件。如果你熟练使用这个软件,你可以制作一些更难的视频。