开发 Web 的一个原则就是,不能信任用户输入的任何信息,所以验证和过滤用户的输入信息就变得非常重要。我们经常会在微博、新闻中听到某某网站被入侵了,存在什么漏洞,这些大多是因为网站对于用户输入的信息没有做严格的验证引起的,所以为了编写出安全可靠的Web程序,验证表单输入的意义重大。
平常编写 Web 应用主要有两方面的数据验证,一个是在页面端的 js 验证(目前在这方面有很多的插件库,比如 ValidationJS 插件),一个是在服务器端的验证,本篇是介绍如何在服务器端验证。
如果想要确保从一个表单元素中得到一个值,例如:登录时用到的用户名,如何处理呢?Go 有一个内置函数 len 可以获取字符串的长度,这样我们就可以通过 len 来获取数据的长度。
例如
if len(r.Form["username"][0])==0{ //为空的处理 }
r.Form对不同类型的表单元素的留空有不同的处理。对于空文本框、空文本区域以及文件上传,元素的值为空值,而如果是未选中的复选框和单选按钮,则根本不会在 r.Form 中产生相应条目,如果用上面代码去获取数据时程序就会报错。所以需要通过 r.Form.Get() 来获取值,因为如果字段不存在,通过该方式获取的是空值。但是通过 r.Form.Get() 只能获取单个的值,如果是 map 的值,必须通过上面代码方式来获取。
想要确保一个表单输入框中获取的只能是数字。例如,想通过表单获取某个人的具体年龄是50岁还是10岁,而不是像“一把年纪了”或“年轻着呢”这种描述。
如果是判断正整数,那么先转化成 int 类型,然后再进行处理。
getint,err:=strconv.Atoi(r.Form.Get("age")) if err!=nil{ // 数字转化出错了,那么可能就不是数字 } // 接下来就可以判断这个数字的大小范围了 if getint >100 { // 太大了 }
还有一种方式就是正则匹配的方式。
if m, _ := regexp.MatchString("^[0-9]+$", r.Form.Get("age")); !m { return false }
对于性能要求很高的用户来说,这是一个老生常谈的问题了,这类用户认为应该尽量避免使用正则表达式,因为使用正则表达式的速度会比较慢。但是在目前机器性能如此强劲的情况下,对于这种简单的正则表达式效率和类型转换函数是没有什么差别的。如果对正则表达式很熟悉,而且你在其它语言中也在使用它,那么在 Go 里面使用正则表达式将是一个便利的方式。
Go 实现的正则是 RE2 ,所有的字符都是 UTF-8 编码的。
有时候想通过表单元素获取一个用户的中文名字,为了保证获取的是正确的中文,我们需要进行验证,而不是用户随便的一些输入。对于中文我们目前有两种方式来验证,可以使用 unicode 包提供的 func Is(rangeTab *RangeTable, r rune) bool 来验证,也可以使用正则方式来验证,这里使用最简单的正则方式,如下代码所示。
if m, _ := regexp.MatchString("^\\p{Han}+$", r.Form.Get("realname")); !m { return false }
当期望通过表单元素获取一个英文值。例如,想知道一个用户的英文名,应该是 astaxie ,而不是 asta谢。
可以很简单的通过正则验证数据。
if m, _ := regexp.MatchString("^[a-zA-Z]+$", r.Form.Get("engname")); !m { return false }
当用户输入一个 Email 地址,可以通过如下方式来验证。
if m, _ := regexp.MatchString(`^([\w\.\_]{2,10})@(\w{1,}).([a-z]{2,4})$`, r.Form.Get("email")); !m { fmt.Println("no") }else{ fmt.Println("yes") }
当用户输入手机号码,可以通过如下正则来验证。
if m, _ := regexp.MatchString(`^(1[3|4|5|8][0-9]\d{4,8})$`, r.Form.Get("mobile")); !m { return false }
对于下拉菜单,有些黑客可能会伪造这个下拉菜单不存在的值发送给你,那么如何判断这个值是否是我们预设的值呢?
<select name="fruit"> <option value="apple">apple</option> <option value="pear">pear</option> <option value="banane">banane</option> </select>
可以这样来验证。
slice := []string{"apple","pear","banane"} for _, v := range slice { if v == r.Form.Get("fruit") { return true } } return false
如果想要判断 radio 按钮是否有一个被选中。例如页面的输出可能就是一个男(1)、女(2)性别的选择。但是也可能无聊程序员在发送请求时候,给你发送一个3。你的程序会出现异常吗?
解决方案:也可以像下拉菜单的判断方式类似,判断我们获取的值是我们预设的值,而不是额外的值。
<input type="radio" name="gender" value="1">男 <input type="radio" name="gender" value="2">女
判断方法如下。
slice:=[]int{1,2} for _, v := range slice { if v == r.Form.Get("gender") { return true } } return false
<input type="checkbox" name="interest" value="football">足球 <input type="checkbox" name="interest" value="basketball">篮球 <input type="checkbox" name="interest" value="tennis">网球
对于复选框,验证和单选有点不一样,因为接收到的数据是一个 slice。
slice:=[]string{"football","basketball","tennis"} a:=Slice_diff(r.Form["interest"],slice) if a == nil{ return true } return false
上面这个函数 Slice_diff 包含在下面库中。https://github.com/astaxie/beeku
Go 里面提供了一个 time 的处理包,可以把用户的输入年月日转化成相应的时间,然后进行逻辑判断。
t := time.Date(2009, time.November, 10, 23, 0, 0, 0, time.UTC) fmt.Printf("Go launched at %s\n", t.Local())
获取 time 之后,就可以进行很多时间函数的操作。具体的判断就根据自己的需求调整。
如果想验证表单输入的是否是身份证,通过正则也可以方便的验证,但是身份证有15位和18位,因此两个都需要验证。
// 验证15位身份证,15位的是全部数字 if m, _ := regexp.MatchString(`^(\d{15})$`, r.Form.Get("usercard")); !m { return false } // 验证18位身份证,18位前17位为数字,最后一位是校验位,可能为数字或字符X。 if m, _ := regexp.MatchString(`^(\d{17})([0-9]|X)$`, r.Form.Get("usercard")); !m { return false }