淘宝2011.9.21校园招聘笔试题选

淘宝2011.9.21校园招聘笔试题选

综合题
1. 有一颗结构如下的树,对其做镜像反转后如下,请写出能实现该功能的代码。注意:请勿对该树做任何假设,它不一定是平衡树,也不一定有序。
   1                               1
  / | \                            / | \
 2 3 4                        4 3 2
 /|\ /\ |                       | / \ / | \
6 5 7 8 9 10         10 9 8 7 5 6
解:
  1. typedef struct TreeNode  
  2. {  
  3.     int data;  
  4.     struct TreeNode *firstchild;  
  5.     struct TreeNode *nextsibling;  
  6. }TreeNode,*Tree;  
  7.   
  8. void MirrorTree(Tree root)  
  9. {  
  10.     if(!root)  
  11.         return ;  
  12.     if(root->firstchild)  
  13.     {  
  14.         Tree p=root->firstchild;  
  15.         Tree cur=p->nextsibling;  
  16.         p->nextsibling=NULL;  
  17.         while(cur)  
  18.         {  
  19.             Tree curnext=cur->nextsibling;  
  20.             cur->nextsibling=p;  
  21.             if(p->firstchild)  
  22.                 MirrorTree(p);  
  23.             p=cur;  
  24.             cur=curnext;  
  25.         }  
  26.         root->firstchild=p;  
  27.     }  
  28. }  
  29.   
  30. int main(void)  
  31. {  
  32.     TreeNode *root=(TreeNode *)malloc(sizeof(TreeNode));  
  33.     Init();  
  34.     MirrorTree(root);  
  35.     OutPut();  
  36. }  

2. 假设某个网站每天有超过10亿次的页面访问量,出于安全考虑,网站会记录访问客户端访问的ip地址和对应的时间,如果现在已经记录了1000亿条数据,想统计一个指定时间段内的区域ip地址访问量,那么这些数据应该按照何种方式来组织,才能尽快满足上面的统计需求呢,设计完方案后,并指出该方案的优缺点,比如在什么情况下,可能会非常慢?
解:
用B+树来组织,非叶子节点存储(某个时间点,页面访问量),叶子节点是访问的IP地址。这个方案的优点是查询某个时间段的IP访问量很快,但是要统计某个IP的访问次数或是上次访问时间就不得不遍历整个树的叶子节点。
或者可以建立二级索引,分别是时间和地点来建立索引。

3. 写出C语言的地址对齐宏ALIGN(P,ALIGNBYTES),其中P是要对齐的地址,ALIGNBYTES是要对齐的字节数(2的N次方),比如说:ALIGN(13,16)=16。
解:ALIGN(P,ALIGNBYTES)  ((void*)(((unsigned long)P+ALIGNBYTES-1)&~(ALIGNBYTES-1)))

4. 在高性能服务器的代码中经常会看到类似这样的代码:
typedef union
{
  erts_smp_rwmtx_t rwmtx;
  byte cache_line_align_[ERTS_ALC_CACHE_LINE_ALIGN_SIZE(sizeof(erts_smp_rwmtx_t))];
}erts_meta_main_tab_lock_t;

erts_meta_main_tab_lock_t main_tab_lock[16];

请问其中用来填充的cache_line_align的作用是?
答:作用是为以后结构体扩展而作用的。

5、在现代web服务系统的设计中,为了减轻源站的压力,通常采用分布式缓存技术,其原理如下图所示,前端的分配器将针对不同内容的用户请求分配给不同的缓存服务器向用户提供服务。
  分配器
  / | \
  缓存 缓存 ...缓存
  服务器1 服务器2 ...服务器n

1)请问如何设置分配策略,可以保证充分利用每个缓存服务器的存储空间(每个内容只在一个缓存服务器有副本)

2)当部分缓存服务器故障,或是因为系统扩容,导致缓存服务器的数量动态减少或增加时,你的分配策略是否可以保证较小的缓存文件重分配的开销,如果不能,如何改进?

3)当各个缓存服务器的存储空间存在差异时(如有4个缓存服务器,存储空间比为4:9:15:7),如何改进你的策略,按照如上的比例将内容调度到缓存服务器?
答:这个问题可以按照memcached原理来做,具体情况具体对待。

你可能感兴趣的:(淘宝2011.9.21校园招聘笔试题选)