大蜥蜴

do_generic_file_read()

ftrace:

 0)               |  vfs_read() {
 0)               |    generic_file_aio_read() {
 0)               |      do_generic_file_read() {
 0)   0.195 us    |        find_get_page();
 0)   0.109 us    |        find_get_page();
 0)   0.263 us    |        touch_atime();
 0)   2.820 us    |      }
 0)   3.559 us    |    }
 0)   5.063 us    |  }

其中，大量重复的路径：

2) ! 11994.70 us |          ocfs2_readpage();
 2)   0.149 us    |          find_get_page();
 2)               |          page_cache_sync_readahead() {
 2)   0.547 us    |            __page_cache_alloc();
 2)   0.181 us    |            __page_cache_alloc();
 2)   0.184 us    |            __page_cache_alloc();
 2)   0.178 us    |            __page_cache_alloc();
 2)   4.190 us    |          }
 2)   0.073 us    |          find_get_page();
 2)   0.176 us    |          __page_cache_alloc();
 2) ! 11983.20 us |          ocfs2_readpage();
 2)   0.150 us    |          find_get_page();
 2)               |          page_cache_sync_readahead() {
 2)   0.525 us    |            __page_cache_alloc();
 2)   0.176 us    |            __page_cache_alloc();
 2)   0.222 us    |            __page_cache_alloc();
 2)   0.185 us    |            __page_cache_alloc();
 2)   4.198 us    |          }
 2)   0.068 us    |          find_get_page();
 2)   0.182 us    |          __page_cache_alloc();
 2) ! 11986.95 us |          ocfs2_readpage();

分析do_generic_file_read()函数：

1258 /**
1259  * do_generic_file_read - generic file read routine
1260  * @filp:   the file to read
1261  * @ppos:   current file position
1262  * @desc:   read_descriptor
1263  * @actor:  read method
1264  *
1265  * This is a generic file read routine, and uses the
1266  * mapping->a_ops->readpage() function for the actual low-level stuff.
1267  *
1268  * This is really ugly. But the goto's actually try to clarify some
1269  * of the logic when it comes to error handling etc.
1270  */
1271 static void do_generic_file_read(struct file *filp, loff_t *ppos,
1272         read_descriptor_t *desc, read_actor_t actor)
1273 {
1274     struct address_space *mapping = filp->f_mapping;
1275     struct inode *inode = mapping->host;
1276     struct file_ra_state *ra = &filp->f_ra;
1277     pgoff_t index;
1278     pgoff_t last_index;
1279     pgoff_t prev_index;
1280     unsigned long offset;      /* offset into pagecache page */
1281     unsigned int prev_offset;
1282     int error;
1283 
1284     index = *ppos >> PAGE_CACHE_SHIFT;
//原来预读结构保存了上次读位置
1285     prev_index = ra->prev_pos >> PAGE_CACHE_SHIFT;
1286     prev_offset = ra->prev_pos & (PAGE_CACHE_SIZE-1);
//last_index应该指的是下次读操作完成后的位置
1287     last_index = (*ppos + desc->count + PAGE_CACHE_SIZE-1) >> PAGE_CACHE_SHIFT;
1288     offset = *ppos & ~PAGE_CACHE_MASK;
1289 
1290     for (;;) {
//一次拷贝一页，末尾页特殊处理
1291         struct page *page;
1292         pgoff_t end_index;
1293         loff_t isize; 
1294         unsigned long nr, ret;
1295      
1296         cond_resched();

割....

1297 find_page: 
//以index为key，在address space的radix tree,即->page_tree中，查找并引用
1298         page = find_get_page(mapping, index);
1299         if (!page) {
//在并发读写同一个文件的测试中，发现总是会查找失败，不知道为什么？像这样：
// 2)               |          page_cache_sync_readahead() {
// 2)   0.857 us    |            __page_cache_alloc();
// 2)   0.205 us    |            __page_cache_alloc();
// 2)   0.185 us    |            __page_cache_alloc();
// 2)   0.180 us    |            __page_cache_alloc();
// 2)   5.096 us    |          }
1300             page_cache_sync_readahead(mapping,
1301                     ra, filp, 
1302                     index, last_index - index);
1303             page = find_get_page(mapping, index);
//难道还是找不到， 又得调用__page_cache_alloc()？
// 2)   0.088 us    |          find_get_page();
// 2)   0.223 us    |          __page_cache_alloc();
1304             if (unlikely(page == NULL))
1305                 goto no_cached_page;
1306         } 
//#define PageReadahead(page)     test_bit(PG_readahead, &(page)->flags)
1307         if (PageReadahead(page)) { 
/**
该页已经被预读到了，说明预读管用，所以可能又顺势多申请一些页面；
 1)               |          page_cache_async_readahead() {
 1)   1.114 us    |            __page_cache_alloc();
 ...
 1)   0.318 us    |            __page_cache_alloc();
 1) + 45.123 us   |          }
 
测试中，凡是进到这儿，就不会去调用ocfs2_readpage, 但是经常会在这里
浪费很多时间，比如
 0) ! 2390.071 us |          __lock_page_killable();
*/
1308             page_cache_async_readahead(mapping,
1309                     ra, filp, page,
1310                     index, last_index - index);
1311         }
1312         if (!PageUptodate(page)) {
//如果页不是最新的
1313             if (inode->i_blkbits == PAGE_CACHE_SHIFT ||
1314                     !mapping->a_ops->is_partially_uptodate)
//如果块大小等于页大小； 或支持局部更新；
1315                 goto page_not_up_to_date;
1316             if (!trylock_page(page))
//page_locked没有置位，那么置位
1317                 goto page_not_up_to_date;
1318             /* Did it get truncated before we got the lock? */
//哪个lock? page_locked吗？
1319             if (!page->mapping)
1320                 goto page_not_up_to_date_locked;
1321             if (!mapping->a_ops->is_partially_uptodate(page,
1322                                 desc, offset))
//全脏
1323                 goto page_not_up_to_date_locked;
1324             unlock_page(page);
1325         }

割...

1326 page_ok:
//页已经在pagecache里面了
1327         /*
1328          * i_size must be checked after we know the page is Uptodate.
1329          *
1330          * Checking i_size after the check allows us to calculate
1331          * the correct value for "nr", which means the zero-filled
1332          * part of the page is not copied back to userspace (unless
1333          * another truncate extends the file - this is desired though).
1334          */
1335 
1336         isize = i_size_read(inode);
1337         end_index = (isize - 1) >> PAGE_CACHE_SHIFT;
1338         if (unlikely(!isize || index > end_index)) {
1339             page_cache_release(page);
1340             goto out;
1341         }
1342 
1343         /* nr is the maximum number of bytes to copy from this page */
1344         nr = PAGE_CACHE_SIZE;
1345         if (index == end_index) {
1346             nr = ((isize - 1) & ~PAGE_CACHE_MASK) + 1;
1347             if (nr <= offset) {
1348                 page_cache_release(page);
1349                 goto out;
1350             }
1351         }
1352         nr = nr - offset;
1353 
1354         /* If users can be writing to this page using arbitrary
1355          * virtual addresses, take care about potential aliasing
1356          * before reading the page on the kernel side.
1357          */
1358         if (mapping_writably_mapped(mapping))
1359             flush_dcache_page(page);
1360 
1361         /*
1362          * When a sequential read accesses a page several times,
1363          * only mark it as accessed the first time.
1364          */
1365         if (prev_index != index || offset != prev_offset)
1366             mark_page_accessed(page);
1367         prev_index = index;
1368 
1369         /*
1370          * Ok, we have the page, and it's up-to-date, so
1371          * now we can copy it to user space...
1372          *
1373          * The actor routine returns how many bytes were actually used..
1374          * NOTE! This may not be the same as how much of a user buffer
1375          * we filled up (we may be padding etc), so we can only update
1376          * "pos" here (the actor routine has to update the user buffer
1377          * pointers and the remaining count).
1378          */
1379         ret = actor(desc, page, offset, nr);
1380         offset += ret;
1381         index += offset >> PAGE_CACHE_SHIFT;
1382         offset &= ~PAGE_CACHE_MASK;
1383         prev_offset = offset;
1384 
//为什么要释放这个页呢？ 
//数据已经从内核态page中，拷贝到用户空间；但万一下次读还是这个页呢？
1385         page_cache_release(page);
//nr代表需要拷贝的字节数， ret表示时间拷贝的字节数u；
//若本次拷贝成功，并且还没有读完
1386         if (ret == nr && desc->count)
1387             continue;
1388         goto out;

割...

1390 page_not_up_to_date:
/* 有时候在此消耗很长时间：
 1) ! 10082.08 us |          __lock_page_killable();
 */
1391         /* Get exclusive access to the page ... */
1392         error = lock_page_killable(page);
1393         if (unlikely(error))
1394             goto readpage_error;
1395 
1396 page_not_up_to_date_locked:
1397         /* Did it get truncated before we got the lock? */
1398         if (!page->mapping) {
1399             unlock_page(page);
1400             page_cache_release(page);
//对应pagecache page没有准备好，从头再来...
1401             continue;
1402         }
1403 
1404         /* Did somebody else fill it already? */
1405         if (PageUptodate(page)) {
1406             unlock_page(page);
1407             goto page_ok;
1408         }

割...

1410 readpage:
1411         /*
1412          * A previous I/O error may have been due to temporary
1413          * failures, eg. multipath errors.
1414          * PG_error will be set again if readpage fails.
1415          */
//不懂...
1416         ClearPageError(page);
1417         /* Start the actual read. The read will unlock the page. */
/*
调用ocfs2_readpage, 也是读耗时最严重的，清一色的严重：
1) ! 12604.57 us |          ocfs2_readpage();
但readpage是pagecache层向block层发送读请求， 为什么要unlock the page呢？
*/
1418         error = mapping->a_ops->readpage(filp, page);
1419 
1420         if (unlikely(error)) {
1421             if (error == AOP_TRUNCATED_PAGE) {
1422                 page_cache_release(page);
1423                 goto find_page;
1424             }
1425             goto readpage_error;
1426         }
1427 
1428         if (!PageUptodate(page)) {
//刚刚从block层，读到pagecache page中的数据怎么会脏呢？
//从测试来看，还没发生这种情况
1429             error = lock_page_killable(page);
1430             if (unlikely(error))
1431                 goto readpage_error;
1432             if (!PageUptodate(page)) {
1433                 if (page->mapping == NULL) {
1434                     /*
1435                      * invalidate_mapping_pages got it
1436                      */
1437                     unlock_page(page);
1438                     page_cache_release(page);
1439                     goto find_page;
1440                 }
1441                 unlock_page(page);
1442                 shrink_readahead_size_eio(filp, ra);
1443                 error = -EIO;
1444                 goto readpage_error;
1445             }
1446             unlock_page(page);
1447         }
1448 
//page_ok表示页准备就绪，接着从内核态往用户态拷贝，拷贝完就退出
1449         goto page_ok;

割...

1451 readpage_error:
1452         /* UHHUH! A synchronous read error occurred. Report it */
1453         desc->error = error;
1454         page_cache_release(page);
1455         goto out;
1456 
1457 no_cached_page:
1458         /*
1459          * Ok, it wasn't cached, so we need to create a new
1460          * page..
1461          */
1462         page = page_cache_alloc_cold(mapping);
1463         if (!page) {
1464             desc->error = -ENOMEM;
1465             goto out;
1466         }
1467         error = add_to_page_cache_lru(page, mapping,
1468                         index, GFP_KERNEL);
1469         if (error) {
1470             page_cache_release(page);
1471             if (error == -EEXIST)
1472                 goto find_page;
1473             desc->error = error;
1474             goto out;
1475         }
1476         goto readpage;
1477     }

割...

1479 out:
1480     ra->prev_pos = prev_index;
1481     ra->prev_pos <<= PAGE_CACHE_SHIFT;
1482     ra->prev_pos |= prev_offset;
1483 
1484     *ppos = ((loff_t)index << PAGE_CACHE_SHIFT) + offset;
1485     file_accessed(filp);
1486 }

你可能感兴趣的:(do_generic_file_read())

Linux read系统调用嘉明-- linux
1read系统调用流程本文内核版本：4.1.15文件系统：ext3read()vfs_read()rw_verify_area()__vfs_read()new_sync_read()generic_file_read_iter()do_generic_file_read()2调用函数分析2.1read()系统调用read()：SYSCALL_DEFINE3(read,unsignedint,fd
Linux read系统调用之 page_cache_sync_readahead() 嘉明-- linux
1page_cache_sync_readahead()上篇文章说道在do_generic_file_read()函数中labelfind_page中调用page_cache_sync_readahead()启动同步预读。voidpage_cache_sync_readahead(structaddress_space*mapping,structfile_ra_state*ra,structfi
文件系统和裸块设备的page cache问题去级得骨灰闲得慌
原文地址：http://www.wowotech.net/filesystem/439.html作者：阿克曼注：本文代码基于linux-3.18.31，此版本中块缓存已经合入页缓存（两个缓存合并的意思是：这里）。普通文件的addressspace文件系统读取文件一般会使用do_generic_file_read()，mapping指向普通文件的addressspace。如果一个文件的某一块不在pa
do_generic_file_read() 大蜥蜴
ftrace: 0) | vfs_read() { 0) | generic_file_aio_read() { 0) | do_generic_file_read() { 0) 0.195 us | find_get_page(); 0) 0.109 us
文件数据读取【续一】 csdyabc 数据
【read--->vfs_read--->do_sync_read--->aio_read--->do_generic_file_read】static void do_generic_file_read(struct file *filp, loff_t *ppos,read_descriptor_t *desc, read_actor_t actor){struct address_space
do_generic_file_read()函数 zhang_shuai_2011 Date cache struct File actor Descriptor
这个函数完成了文件读的主要流程核心在于操作页高速缓存，如缺页，失效，预读等操作。函数中goto语句不计其数，staticvoiddo_generic_file_read(structfile*filp,loff_t*ppos, read_descriptor_t*desc,read_actor_tactor){ structaddress_space*mapping=filp->f_
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round