为什么801的shell 浮点运算算比835还厉害?

查看: 117|回复: 1
求助 F4进行浮点运算比定点运算快 ,是为什么?
主题帖子精华
高级会员, 积分 598, 距离下一级还需 402 积分
在线时间105 小时
int main(void)
& & & & int t,j;
& & & & u8& & & &
& & & & u32 a=64,b=32,c;
& & & & float x=111.1,y=32.2,z;
& & & & u16 times=0;&&
& & & & NVIC_PriorityGroupConfig(NVIC_PriorityGroup_2);//设置系统中断优先级分组2
& & & & delay_init(168);& & & & & & & & //延时初始化
& & & & uart_init(115200);& & & & //串口初始化波特率为115200
& & & & LED_Init();& & & & & & & && && & & & & & & & //初始化与LED连接的硬件接口&&
& & & & while(1)
& & & & & & & & for(j=0 ,a=0,x=0;j&300;j++)
& & & & & & & & {
& & & & & & & & & & & & x++;a++;
& & & & & & & & for(t=0;t&30000;t++)
& & & & & & & & {
& & & & & & & & & & & & c=a/b;
& & & & & & & & & & & & //z=x/y;
& & & & & & & & & & & &
& & & & & & & & }
& & & & & & & & LED0=!LED0;
& & & & & & & & LED1=!LED1;
进行900万次定点和浮点的计算,浮点运算时LED1闪烁要比顶点运算快,请问是为什么
主题帖子精华
中级会员, 积分 338, 距离下一级还需 162 积分
在线时间68 小时
自己去看反汇编结果,,把指令扒拉出来,理清思路后查手册,每条指令执行时间。然后就可以推演完成定点运算和浮点运算的时间,就完事了。
Powered by为什么 CPU 的浮点运算能力比 GPU 差,为什么不提高 CPU 的浮点运算能力?
我的图书馆
为什么 CPU 的浮点运算能力比 GPU 差,为什么不提高 CPU 的浮点运算能力?
【的回答(64票)】:
的答案是一个常见的说法,但是没有触及到本质。
首先,「速度区别主要是来自于架构上的区别」是一个表面化的解释。对,架构是不同。但是这种不同是目前各个厂家选择的现状,还是由于本质的原因决定的?CPU 能不能增加核?GPU 那张图为什么不需要 cache?
首先,CPU 能不能像 GPU 那样去掉 cache?不行。GPU 能去掉 cache 关键在于两个因素:数据的特殊性(高度对齐,pipeline 处理,不符合局部化假设,很少回写数据)、高速度的总线。对于后一个问题,CPU 受制于落后的数据总线标准,理论上这是可以改观的。对于前一个问题,从理论上就很难解决。因为 CPU 要提供通用性,就不能限制处理数据的种类。这也是 GPGPU 永远无法取代 CPU 的原因。
其次,CPU 能不能增加很多核?不行。首先 cache 占掉了面积。其次,CPU 为了维护 cache 的一致性,要增加每个核的复杂度。还有,为了更好的利用 cache 和处理非对齐以及需要大量回写的数据,CPU 需要复杂的优化(分支预测、out-of-order 执行、以及部分模拟 GPU 的 vectorization 指令和长流水线)。所以一个 CPU 核的复杂度要比 GPU 高的多,进而成本就更高(并不是说蚀刻的成本高,而是复杂度降低了成片率,所以最终成本会高)。所以 CPU 不能像 GPU 那样增加核。
至于控制能力,GPU 的现状是差于 CPU,但是并不是本质问题。而像递归这样的控制,并不适合高度对齐和 pipeline 处理的数据,本质上还是数据问题。
【Clones的回答(9票)】:
速度区别主要是来自于架构上的区别。架构的不同则是因为的设计目的不一样。
英伟达的CUDA文档里给了这样一幅图:
其中ALU就是“算术逻辑单元()”。
CPU和GPU进行计算的部分都是ALU,而如图所示,GPU绝大部分的芯片面积都是ALU,而且是超大阵列排布的ALU。这些ALU都是可以并行运行的,所以浮点计算速度就特别高了。
相比起来,CPU大多数面积都需要给控制单元和Cache,因为CPU要承担整个的控制工作,没有GPU那么单纯。
所以GPU的程序控制能力相比CPU来说不强,稍早时候的CUDA程序像是递归都是不能用的(较新的设备上可以了)。
我觉得也不是CPU不能提高浮点计算速度,而是因为没什么特别的必要了。咱们通常的桌面应用根本没有什么特别的浮点计算能力要求。而同时GPU这样的设备已经出现了,那么需要浮点计算的场合利用上就行了
【石磊的回答(0票)】:
外行看热闹。
其实这是跟人类的需求相负荷的,最早出来的时候人们对多媒体并没有这么大的需求,也就是对浮点的需求并不强烈,那自然就先解决重要的整数了,就这样一直发展着,直到后来GPU后来才有了较大发展。
至于说为什么现在不提高cpu,只能说不需要不划算,cpu是通用型的设备,它要提供多种复杂的服务,而Gpu则相对来说比较单一,这样实现相同功能gpu最划算,就像常见的家用游戏机的效果比电脑好一样,实际上我们可以看到电脑的配置并不必家用机差,这就是专用和通用体现出来的一些区别,当然这些是基于现在的情况。
【王磊的回答(0票)】:
GPU的出现就是为了大量的浮点运算(图形图像处理),除图形图像外的其他任务很少用到浮点运算,所以CPU不是不能提高浮点运算能力,而是没必要。也许未来的哪一天GPU再次和CPU整合,不再作为单独的部件存在了。
这世界嘛,合久必分分久必合。
【伊恩别的回答(0票)】:
首先想纠正一下可能有的误解:CPU不是"不能"拥有那么高的浮点运算能力,而是不能在固定的成本下,在满足其它通用计算的性能的前提下,还拥有那么高的浮点运算能力。图中标出的都是对应年份发布的商品的性能,而不是技术能达到极限能力。另外,CPU的最主要用途是来做通用计算,而不是浮点运算,所以浮点运算的能力只要够用就好。
【劳钧浩的回答(0票)】:
XBOX是最佳解决方案,请百度
馆藏&68144
TA的推荐TA的最新馆藏
喜欢该文的人也喜欢经验3570 米
在线时间59 小时
版本7.6.14
机型小米手机3/4 WCDMA版
签到次数49
MIUI版本7.6.14
Screenshot_-19-28-04-753_com.cpuid.cpu_z.png (235.98 KB, 下载次数: 0)
小米6处理器835,这里面显示的是801和800合成的?谁能解释一下
分享到微信朋友圈
打开微信,点击底部的“发现”,使用 “扫一扫” 即可将网页分享到我的朋友圈。
经验864 米
在线时间84 小时
版本7.8.10
积分 1120, 距离下一级还需 880 积分
积分 1120, 距离下一级还需 880 积分
机型小米手机6
签到次数15
MIUI版本7.8.10
谁告诉你那个是型号的?
8998就是835
还合成。。。
游戏打多了?
经验3570 米
在线时间59 小时
版本7.6.14
机型小米手机3/4 WCDMA版
签到次数49
MIUI版本7.6.14
谁告诉你那个是型号的?
8998就是835
还合成。。。
8998,还真不懂?只认801
经验7527 米
在线时间415 小时
版本7.9.14
Android 8.0荣誉内测
机型小米手机6
签到次数16
MIUI版本7.9.14
msm8998,没问题的
经验1172 米
在线时间40 小时
版本7.9.20
MIUI BUG TEST MIUI BUG FEEDBAC
机型红米Note4X 高通版
MIUI版本7.9.20
为了进入内测组,拼了,多有打扰请多原谅。
经验1748 米
在线时间28 小时
版本7.9.14
机型红米Note3 全网通
签到次数20
MIUI版本7.9.14
为了进入内测组,拼了,多有打扰请多原谅。
经验1888 米
在线时间50 小时
版本7.9.27
机型小米手机6
签到次数17
MIUI版本7.9.27
哦?好神奇
经验2351 米
在线时间29 小时
积分 2481, 距离下一级还需 2519 积分
积分 2481, 距离下一级还需 2519 积分
机型红米手机2A 标准版/增强版
签到次数29
MIUI版本7.6.8
那msm8998是啥
经验1459 米
在线时间43 小时
版本7.7.17
积分 1700, 距离下一级还需 300 积分
积分 1700, 距离下一级还需 300 积分
机型小米手机6
MIUI版本7.7.17
没毛病,啊。。。
经验1428 米
在线时间23 小时
版本7.8.15
积分 1591, 距离下一级还需 409 积分
积分 1591, 距离下一级还需 409 积分
机型小米手机6
MIUI版本7.8.15
别管什么字母,反正就是835你自己知道就行,下面有10纳米工艺 看见没
米兔月饼勋章
参加回帖活动
MIUI七夕鹊桥勋章
MIUI七周年
MIUI 9纪念勋章
小米众筹2周年
参加回帖活动
新版论坛APP
更新新版APP
已关注微信
关注新浪微博
已关注新浪微博
Copyright (C) 2017 MIUI
京ICP备号 | 京公网安备34号 | 京ICP证110507号性能大对比 骁龙821比骁龙820强多少?_网易手机
性能大对比 骁龙821比骁龙820强多少?
用微信扫码二维码
分享至好友和朋友圈
(原标题:性能大对比 骁龙821比骁龙820强多少?)
【手机中国 评测】7月11日,高通正式发布最新旗舰处理器骁龙821。7月13日,华硕就发布了新款旗舰机ZenFone 3 Deluxe尊爵版,从而成为全球首款搭载高通骁龙821处理器的手机产品。而这个9月份,我们也将迎来更多的骁龙821旗舰,那么骁龙821的性能相比骁龙820有多少提升?已经拥有骁龙820旗舰的用户是否需要更换骁龙821旗舰呢?今天我们就通过数据对比来进行解答。华硕ZenFone 3 Deluxe&首先来看下骁龙820以及骁龙821在参数上的有什么区别,通过对比可以看出,两款处理器都是采用14nm FiFET三星第二代LPP工艺技术、全新四核64位Kryo CPU以及Adreno 530 GPU,主要的区别还是在主频上。骁龙820的CPU大核主频2.2GHz、小核主频1.6GHz,GPU主频624MHz;骁龙821的CPU大核主频2.4GHz、小核主频2GHz,GPU主频650MHz。也就是说,骁龙821的CPU性能提升10%,而GPU的提升为5%。骁龙821/骁龙820参数对比接着进入实战跑分环节,我们选择的两款手机在配置上几乎一致,一款是骁龙820处理器+6GB RAM+64GB ROM,另一款则是骁龙821处理器+6GB RAM+64GB ROM,所以测试结果还是比较有代表性的。安兔兔测试数据显示,骁龙821手机的总得分为163546,而骁龙820手机总得分为142114,性能上确实是骁龙821要强一些。在单项环节的对比上,骁龙821也差不多做到全面压制,特别是在CPU、图像运算以及3D性能方面,骁龙821的优势都比较明显。骁龙821/骁龙820跑分对比通过对比可以看出,相比骁龙820而言,骁龙821只是一个经过小幅升级的版本,有些类似当年的骁龙801和骁龙800,骁龙801也是提升了CPU和GPU主频,同时加入对eMMC 5.0和双卡双待的支持;骁龙821除了主频的提升外,还将支持双PDAF相位对焦以及扩展激光对焦测距技术,可以提升手机的拍摄实力。骁龙
对于已经拥有骁龙820旗舰的用户来说,骁龙821虽然性能方面确实有提升,但是由于骁龙820自身本就够强了,骁龙821带来的性能提升在日常使用中并不会特别明显,如果你不是款爷的话,没有必要追新。不过随着大波儿骁龙821旗舰的问世,有望让骁龙820手机的价格更亲民。北京时间9月8日凌晨1点,新一代iPhone及A10芯片将亮相,届时我们再来比比看,骁龙821和苹果A10谁是真正NO.1。
本文来源:手机中国
责任编辑:"王晓易_NE0011"
用微信扫码二维码
分享至好友和朋友圈
加载更多新闻
热门产品:   
:        
:         
热门影院:
阅读下一篇
用微信扫描二维码
分享至好友和朋友圈扫二维码下载作业帮
2亿+学生的选择
下载作业帮安装包
扫二维码下载作业帮
2亿+学生的选择
关于整数运算和浮点数的问题为什么一般情况下整数运算比浮点数运算更快?
扫二维码下载作业帮
2亿+学生的选择
现在一般认为整数和浮点数运算差不多,都是通过硬件完成.(整数还是快点)为什么一般情况下整数运算比浮点数运算更快?主要是数表示的原因:整数:正数是原码,负数是补码,加法可以直接相加,乘法也可以很快完成浮点数:第一位是符号位,表示正负,然后是阶码(用移码表示),有若干位,最后的是尾数(用原码表示)很明显,浮点数的加法运算首先要进行对位,就是把阶码变得一致,然后再按整数相加,最后再作调整,成为规范数,当然比整数慢了,整数就直接相加,乘法的原理也差不多,除了尾数,还要对阶码进行考虑
为您推荐:
其他类似问题
扫描下载二维码

我要回帖

更多关于 cpu浮点运算能力 的文章

 

随机推荐