IT博客汇 | [原]Go语言核心技术(卷一):基本单元2

[原]Go语言核心技术(卷一):基本单元2

abv123456789发表于 2016-03-14 21:37:12

三.变量

1声明变量

使用var关键字可以创建一个指定类型的变量：

var i int = 0
var i = 0
var i int

以上三个表达式均是合法的，第三个表达式会将i初始化为int类型的零值，0；如果i是bool类型，则为false；i是float64类型，则为0.0；i为string类型，则为""；i为interface类型，则为nil；i为引用类型，则为nil；如果i是struct，则是将struct中所有的字段初始化为对应类型的零值。

这种初始化机制可以保证任何一个变量都是有初始值的，这样在做边界条件条件检查时不需要担心值未初始化，可以避免一些潜在的错误，相信C和C++程序员的体会更加深入。

var s string
fmt.Println(s) // ""

这里的s是可以正常打印的，而不是导致某种不可预期的错误。

可以在同一条语句中声明多个变量：

var i, j, k int                 // int, int, int
var b, f, s = true, 2.3, "four" // bool, float64, string

包内可见的变量在main函数开始执行之前初始化，本地变量在函数执行到对应的声明语句时初始化。

变量也可以通过函数的返回值来初始化:

var f, err = os.Open(name) // os.Open returns a file and an error

2.短声明

在函数内部，有一种短声明的方式，形式是name := expression，这里，变量的类型是由编译器自动确定的。

anim := gif.GIF{LoopCount: nframes}
freq := rand.Float64() * 3.0
t := 0.0

因为这种形式非常简洁，因此在函数内部(本地变量)大量使用。如果需要为本地变量显式的指定类型，或者先声明一个变量后面再赋值，那么应该使用var：

i := 100                  // an int
var boiling float64 = 100 // a float64

var names []string
var err error
var p Point

就像var声明一样，短声明也可以并行初始化,

i, j := 0, 1

要谨记的是，:=是一个声明，=是一个赋值，因此在需要赋值的场所不能使用 :=

var i int
i := 10//panic : no new variables on left side of :=

可以利用并行赋值的特性来进行值交换:

i, j = j, i // swap values of i and j

有一点需要注意的：短声明左边的变量未必都是新声明的！

in, err := os.Open(path1) //新声明两个变量:in, err
//...
out, err := os.Create(path2) 
/*因为err已经声明过，因此这里只新声明一个变量out。
虽然这里使用:=，但是err是在上个语句声明的，这里仅仅是赋值*/

而且，短声明的左边变量必须有一个是新的，若都是之前声明过的，会报编译错误:

f, err := os.Open(infile)
// ...
f, err := os.Create(outfile) // compile error: no new variables

正确的写法是这样的:

f, err := os.Open(infile)
// ...
f, err = os.Create(outfile) // compile ok

3.指针

值变量的存储地址存的是一个值。例如 x = 1 就是在x的存储地址存上1这个值； x[i] = 1 代表在数组第i + 1的位置存上1这个值；x.f = 1，代表struct x中的f字段所在的存储位置存上1这个值。

指针值是一个变量的存储地址。注意：不是所有的值都有地址，但是变量肯定是有地址的！这个概念一定要搞清楚！通过指针，我们可以间接的去访问一个变量，甚至不需要知道变量名。

var x int = 10
p := &x	
/*&x是取x变量的地址，因此p是一个指针，指向x变量.
这里p的类型是*int,意思是指向int的指针*/
fmt.Printf("addr:%p, value:%d\n", p, *p)
//output: addr:0xc820074d98, value:10
*p = 20 // 更新x到20

上面的代码中，我们说p指向x或者p包含了x的地址。*p的意思是从p地址中取出对应的变量值，因此*p就是x的值：10。因为*p是一个变量，因此可以作为左值使用，*p = 20，这时代表p地址中的值更新为20，因此这里x会变为20。下面的例子也充分解释了指针的作用:

x := 1
p := &x         // p类型:*int,指向x
fmt.Println(*p) // "1"
*p = 2          // 等价于x = 2
fmt.Println(x)  // "2"

聚合类型struct或者array中的元素也是变量，因此是可以通过寻址(&)获取指针的。

若一个值是变量，那么它就是可寻址的，因此若一个表达式可以作为一个变量使用时，意味着该表达式可以寻址，也可以被使用&操作符。

｀指针的零值是nil(记得之前的内容吗？go的所有类型在没有初始值时都默认会初始化为该类型的零值)。若p指向一个变量，那么p != nil 就是true,因为p会被赋予变量的地址。指针是可以比较的，两个指针相等意味着两个指针都指向同一个变量或者两个指针都为nil。

var x, y int
fmt.Println(&x == &x, &x == &y, &x == nil) // "true false false"

在函数中返回一个本地变量的地址是很安全的。例如以下代码，本地变量v是在f中创建的，从f返回后依然会存在，指针p仍然会去引用v

var p = f()
fmt.Println(*p) //output:1
func f() *int {
    v := 1
    return &v
}

每次调用f都会返回不同的指针，因为f会创建新的本地变量并返回指针:

fmt.Println(f() == f()) // "false"

把变量的指针传递给函数，即可以在函数内部修改该变量(go的函数默认是值传递，所有的值类型都会进行内存拷贝)

func incr(p *int) int {
    	*p++ // increments what p points to; does not change p
    	return *p
}

v := 1
incr(&v)              // v现在是2
fmt.Println(incr(&v)) // "3" (and v is 3)

指针在flag包中是很重要的。flag会读取程序命令行的参数，然后设置程序内部的变量。下面的例子中，我们有两个命令行参数：-n，不打印换行符；-s sep，使用自定义的字符串分隔符进行打印.

package main

import (
    "flag"
    "fmt"
    "strings"
)

var n = flag.Bool("n", false, "忽略换行符")
var sep = flag.String("s", " ", "分隔符")

func main() {
	flag.Parse()
	fmt.Print(strings.Join(flag.Args(), *sep))
	if !*n {
  	      fmt.Println()
  	}
}

flag.Bool会创建一个bool类型的flag变量，flag.Bool有三个参数：flag的名字，命令行没有传值时默认的flag值(false),flag的描述信息( 当用户传入一个非法的参数或者-h、 -help时，会打印该描述信息)。变量sep和n 都是flag变量的指针，因此要通过*sep和*n来访问原始的flag值。

当程序运行时，在使用flag值之前首先要调用flag.Parse。非flag参数可以通过args := flag.Args()来访问，args的类型是[]string(见后续章节)。如果flag.Parse报错，那么程序就会打印出一个使用说明，然后调用os.Exit(2)来结束。

让我们来测试一下上面的程序：

$ go build gopl.io/ch2/echo4
$ ./echo4 a bc def
a bc def
$ ./echo4 -s / a bc def
a/bc/def
$ ./echo4 -n a bc def
a bc def$
$ ./echo4 -help
Usage of ./echo4:
     -n    忽略换行符
     -s string
	 分隔符 (default " ")

4.new函数

还可以通过内建(built-in)函数new来创建变量。new(T)会初始化一个类型为T的变量，值为类型T对应的零值，然后返回一个指针：*T。

p := new(int)   // p,类型*int,指向一个没有命名的int变量
fmt.Println(*p) // "0"
*p = 2          
fmt.Println(*p) // "2"

这种声明方式和普通的var声明再取地址没有区别。如果你不想绞尽脑汁的去思考一个变量名，那么就可以使用new:

func newInt() *int {            func newInt() *int {
    return new(int)                 var dummy int
}                                   return &dummy
                                }

每次调用new都会返回一个唯一的地址

p := new(int)
q := new(int)
fmt.Println(p == q) // "false"

但是有一个例外：比如struct{}或[0]int,这种类型的变量没有包含什么信息且为零值，可能会有同样的地址。

new函数相对来说是较少使用的，因为最常用的未具名变量是struct类型，对于这种类型而言，相应的struct语法更灵活也更适合。

因为new是预定义的函数名(参见上一节的保留字),不是语言关键字，因此可以用new做函数内的变量名:

func delta(old, new int) int { return new - old }

当然，在delta函数内部，是不能再使用new函数了！

5.变量的生命期

变量的生命期就是程序执行期间变量的存活期。包内可见的变量的生命期是固定的：程序的整个执行期。作为对比，本地变量的生命期是动态的：每次声明语句执行时，都会创建一个新的变量实例，变量的生命期就是从创建到不可到达状态(见下文)之间的时间段，生命期结束后变量可能会被回收。

函数的参数和本地变量都是动态生命期，在每次函数调用和执行的时候，这些变量会被创建。例如下面的代码：

for t := 0.0; t < cycles*2*math.Pi; t += res {
	x := math.Sin(t)
 	y := math.Sin(t*freq + phase)
 	img.SetColorIndex(size+int(x*size+0.5), size+int(y*size+0.5),
 	      blackIndex)
	}

每次for循环执行时，t,x,y都会被重新创建。

那么GC是怎么判断一个变量应该被回收呢？完整的机制是很复杂的，但是基本的思想是寻找每个变量的过程路径，如果找不到这样的路径，那么变量就是不可到达的，因此就是可以被回收的。

一个变量的生命期只取决于变量是否是可到达的，因此一个本地变量可以在循环之外依然存活，甚至可以在函数return后依然存活。编译器会选择在堆上或者栈上去分配变量，但是请记住：编译器的选择并不是由var或者new这样的声明方式决定的。

var global *int

func f() {                      func g() {
    var x int                       y := new(int)
    x = 1                           *y = 1
    global = &x                 }
}

上面代码中，x是在堆上分配的变量，因为在f返回后，x也是可到达的(global指针)。这里x是f的本地变量，因此，这里我们说x从f中逃逸了。相反，当g返回时，变量*y就变为不可到达的，然后会被垃圾回收。因为*y没有从g中逃逸，所以编译器将*y分配在栈上(即使是用new分配的)。在绝大多数情况下，我们都不用担心变量逃逸的问题，只要在做性能优化时意识到：每一个逃逸的变量都需要进行一次额外的内存分配。

尽管自动GC对于写现代化的程序来说，是一个巨大的帮助，但是我们也要理解go语言的内存机制。程序不需要显式的内存分配或者回收，可是为了写出高效的程序，我们仍然需要清楚的知道变量的生命期。例如，在长期对象(特别是全局变量)中持有指向短期对象的指针，会阻止GC回收这些短期对象，因为在这种情况下，短期对象是可以到达的！！

欢迎大家加入Go语言核心技术QQ群894864，里面热心大神很多哦！