Apr 17 2014

Programming with PTRACE, Part1 - 起步

前言

本人作为一个信息学竞赛的参与者，在很久之前曾经试图自己写过一个Online Judge系统（允许用户上传源代码并在服务器上编译运行），考虑到安全因素，必须要对程序的行为进行限制，因此对ptrace进行了一番研究。网上有一份关于ptrace的很好的教程（Playing with ptrace）,但是时间有点久了，而且没有涉及64位操作系统。因此，我决定写这份教程，基于64位Linux，尽力介绍一些新加入的功能，同时兼顾一下32位系统。另外，由于一开始的目的是“对程序的行为进行限制”，所以不会涉及到诸如设置断点之类的内容，相反，可能会涉及到其他关于系统资源管理的内容。
ptrace()是一个由Linux内核提供的系统调用。它允许一个用户态进程检查、修改另一个进程的内存和寄存器。这种技术被广泛用于gdb等调试器中。尽管这系列文章的标题叫做“Programming with PTRACE”，但在第一部分中，我将着重介绍Linux的进程和相关的几个重要函数。

fork(), vfork() 与 clone()

在Linux中，每一个进程都有一个唯一的编号，被称作pid(Process ID)。在Linux中，进程不能凭空产生（init进程是个例外），只能从一个已有进程衍生出来。原来的进程被称做父进程，衍生出来的进程叫子进程。一个系统中所有进程以父子关系相连接，形成一棵树，这棵“树”的树根就是init进程，它是在系统启动时被直接启动的，因此它没有父进程。并且系统中所有其他进程都直接或间接地是它的子进程。在Linux系统中，实现“把一个进程变成两个”这一功能的有三个系统调用，即fork()、vfork()和clone()。

fork()的工作流程的确和叉子有几分相似之处，它将当前进程所有数据复制一份，产生一个和父进程一模一样的子进程。并在两个进程中返回不同的返回值。比如这段代码：

demo1.c

#include <stdio.h>
#include <unistd.h>
int main(int argc,char *argv[]){
    int return_val;
    puts("Program started.");
    return_val=fork();
    printf("fork() returned %d\n",return_val);
    return 0;
}

将会输出

Program started.
fork() returned 5768
fork() returned 0

很明显地可以看到，puts()只被调用了一次而printf()被调用了两次，这说明在fork()前的一个进程变成了两个，而且fork()在两个进程中有不同的返回值（这就是“调用一次，返回两次”的来历）。fork()会返回0给子进程，返回子进程的pid给父进程，因此，我们很容易判断出fork() returned 0是由子进程打印的。在实际应用中，也通过if语句判断返回值的方法来决定执行不同的代码：

int pid=fork();
if (pid==0){
  //子进程的工作
}else{
  //父进程的工作
}

一般来说，子进程的工作就是调用exec族函数，启动另一个程序(把自己替换掉)。如果子进程还在执行而父进程已结束，那么它就成为“孤儿”进程，成为init进程的子进程。另外，请不要纠结那个if判断带来的性能损失，Linux的内核开发者都不纠结，你纠结什么呢？

Mar 19 2014

有屏幕的地方就有烂苹果

如果你还不知道Bad Apple是什么东西，请移步这里
播放的原理很简单，就是不停的打印清屏再打印清屏。任何一个略有编程基础的人都能做到。比较令人头大的是如何把原视频转化为一个易于解析而且又不占地方的文件。
其实，借助FFmpeg、ImageMagick和一点点的编程小技巧就可以轻松完成。

第一步当然是要去下一个视频文件，我已经下好了，叫做BadApple.mkv。

Feb 28 2014

在Linux下使用MinGW静态交叉编译带有zlib的libcurl

libcurl是一个跨平台的、易用的、强大的网络库。在大部分Linux发行版中都有编译好的二进制包可供使用，Mac系统更是将其作为了一个核心部件。但是在Windows平台上却需要手工编译，更不必说一些有特殊洁癖的人（比如说我）还特别讨厌多出来几个DLL,非要静态链接不可。本文作为我两个晚上折腾经历的一个小小总结，讲解如何在Linux下使用MinGW编译给Windows使用的libcurl静态库。

Feb 8 2014

记一次坑爹的乱码解决过程

某日，我在网上下载了一些音乐，然后打开，发现了乱码。Linux系统上出现乱码本不是什么好大惊小怪的事，但是，在经过N种方法来回折腾依然无法解决的情况下，我意识到，这大约是我见过的最奇葩的一种乱码了。先上图：
An Example of the Messy Code

Dec 24 2013

网站从Octopress迁移至Hexo

经过我两个小时的折腾，总算是重新把网站弄起来了。Ruby实在是坑爹，各种gem装得目录结构乱七八糟的……（强迫性人格障碍的典型表现）而且速度还慢……
曾尝试用Python和Tornado模板自己写一个静态页面生成器，然后发现我想多了。我果然还是不适合写UI……
一通Google之后，最终决定使用Hexo。它使用node.js(也就是javascript)作为编程语言(这样说恰当么？反正就是这个意思啦),据说速度极快。最重要的是，AUR源里有Hexo打好的包，能用pacman管理就是好。
主题试了一圈下来还是默认的Light看着最舒心。以后千万不能再手贱自己写主题了！！
膜拜一下Hexo的作者tommy351。自己改了一下高亮配色和Widgets，把以前Octopress的Markdown文档做了一点点修改，这样就算上线了吧。

Mar 30 2013

通用存储及分布式文件共享系统的设想

Update: 本计划已无限期暂停，在可预见的未来没有重启计划，如有需要资料的欢迎发邮件索取

众所周知，网盘这东西对大众来说不可或缺，国内的在线存储服务也欣欣向荣。但是，由于各种原因，我们仍感到这些不能完全满足我们的要求。
比如各种限制、各种暂停分享、还有各种必须付钱才能用的VIP服务等。各大公司想挣钱无可非议，毕竟网络存储绝对是烧钱的主，但作为一个搞技术的人，决不能整天写登陆界面，对吧？
动机在新浪微盘数据结构解析中说了，在那之后我又研究了其他的网盘，萌生了这么一个设想。
简要的说，这个系统可以大大方便文件的传播与获取，延长资源的存活时间。

Jan 31 2013

Pascal中鲜为人知的那些技巧

做为一个搞信息学竞赛这么长时间的人，再加上估计很快就要转C++了，我觉得我有必要留下一些关于Pascal语言的资料，于是就有了这篇文章。我只负责解释用法，对基础概念不了解的请自行Google。所有这篇文章里的东西应该都能在Free Pascal自带的文档里找到，我写出来是为了众多不喜欢看英文的同学们，如果你愿意自己去看一下，一定会收益匪浅。

不同进制的表示

平时我们写的常量都是十进制数，但我们有时需要写一个比如十六进制数怎么办呢？我们当然可以手动计算一下，但还有更优雅的方法。

writeln($Ff,#32,&10,#32,%100);

你觉得它会输出什么呢？它输出255 8 4!所以以$开头的是16进制数，&开头的是8进制数，%开头的是二进制数。顺带一提的是，以#开头的数会转变成对应ASCII码的字符，其实它可以和前面的三个符号共同使用，即#$20和#%100000都代表了空格。