1.思想
创造一种普适的算法,从数据中挖掘出有趣的东西,而不需要针对某个问题去写代码。只需要把数据“投喂”给普适算法,然后在数据上建立自己的逻辑。
机器学习是个筐,什么普适算法都往里装
2. 分类
1. 有监督学习
2. 无监督学习
内存单元从0开始编号,称为内存地址。每个内存单元可以看作一间房间,内存地址就是门牌号。
数据类型
基本数据类型/原始类型(primitive type)
用于保存简单的单个数据
首字母一般小写
基本数据类型:
Java的整型数字中间可以加入下划线以便用户识别。
- 对于float类型,需要加上f后缀,如:
float f = 3.14e5f;
- float类型可最大表示 $3.4 \times 10^{38}$
float类型可最大表示 $1.79 \times 10^{308}$
Java语言对布尔类型的存储并没有做规定,因为理论上存储布尔类型只需要1 bit,但是通常JVM内部会把boolean表示为4字节整数。
- 布尔类型boolean只有true和false两个值
- 字符类型char表示一个字符。Java的char类型除了可表示标准的ASCII外,还可以表示一个Unicode字符,如:
char a = '中';
- 注意char类型使用单引号’,且仅有一个字符,要和双引号”的字符串类型区分开。
引用类型
- 除了上述基本类型的变量,剩下的都是引用类型。例如,引用类型最常用的就是String字符串:
String s = "hello";
- 引用类型的变量类似于C语言的指针,它内部存储一个“地址”,指向某个对象在内存的位置.
通俗的解释:引用类型的变量赋值,先申请内存存放内容,然后变量再指向它,若改变变量的值,则会再重新申请内存,放入内容,再将变量指向这块内存,原来的内存还在只不过无法通过变量指向它罢了。
常量
- 定义变量的时候,如果加上final修饰符,这个变量就变成了常量
1 | final double PI = 3.14; // PI是一个常量 |
- 常量在定义时进行初始化后就不可再次赋值,再次赋值会导致编译错误。
- 常量的作用是用有意义的变量名来避免魔术数字(Magic number),例如,不要在代码中到处写3.14,而是定义一个常量。如果将来需要提高计算精度,我们只需要在常量的定义处修改,例如,改成3.1416,而不必在所有地方替换3.14。
- 根据习惯,常量名通常全部大写。
var关键字
- 有些时候,类型的名字太长,写起来比较麻烦。例如:
StringBuilder sb = new StringBuilder();
, 这个时候,如果想省略变量类型,可以使用var关键字:var sb = new StringBuilder();
,编译器会根据赋值语句自动推断出变量sb的类型是StringBuilder。对编译器来说,语句:var sb = new StringBuilder();
,实际上会自动变成:StringBuilder sb = new StringBuilder();
- 使用var定义变量,仅仅是少写了变量类型而已。
定义变量时,要遵循作用域最小化原则,尽量将变量定义在尽可能小的作用域,并且,不要重复使用变量名。
整数运算
+=
,-=
,*=
,/=
:同C++>>
: 根据符号位来补充>>>
: 它的特点是不管符号位,右移后高位总是补0&
|
~
^
运算优先级
()
! ~ ++ --
* / %
+ -
<< >> >>>
&
|
+= -= *= /=
浮点数运算
浮点数运算会产生误差
浮点数运算和整数运算相比,只能进行加减乘除这些数值计算,不能做位运算和移位运算。在计算机中,浮点数虽然表示的范围大,但是,浮点数有个非常重要的特点,就是浮点数常常无法精确表示。
举个栗子:
浮点数0.1在计算机中就无法精确表示,因为十进制的0.1换算成二进制是一个无限循环小数,很显然,无论使用float还是double,都只能存储一个0.1的近似值。但是,0.5这个浮点数又可以精确地表示。
因为浮点数常常无法精确表示,因此,浮点数运算会产生误差:
1 | public class Main { |
结果为:
1 | 0.1 |
溢出
整数运算在除数为0时会报错,而浮点数运算在除数为0时,不会报错,但会返回几个特殊值:
- NaN表示Not a Number
- Infinity表示无穷大
- Infinity表示负无穷大
如:
1 | double d1 = 0.0 / 0; // NaN |
布尔运算
>,>=,<,<=,==,!=
&&
||
!
!
>,>=,<,<=
==,!=
&&
||
字符与字符串
字符类型
Java在内存中总是使用Unicode表示字符,所以,一个英文字符和一个中文字符都用一个char类型表示,它们都占用两个字节。要显示一个字符的Unicode编码,只需将char类型直接赋值给int类型即可
1 | int n1 = 'A'; // 字母“A”的Unicodde编码是65 |
字符串类型
和char类型不同,字符串类型String是引用类型,我们用双引号
"..."
表示字符串。一个字符串可以存储0个到任意个字符:
常见的转义字符包括:
\"
表示字符"
\'
表示字符'
\\
表示字符\
\n
表示换行符\r
表示回车符\t
表示Tab
\u####
表示一个Unicode编码的字符字符串连接
Java的编译器对字符串做了特殊照顾,可以使用+连接任意字符串和其他数据类型,这样极大地方便了字符串的处理。例如:
1 | public class Main { |
如果用+连接字符串和其他数据类型,会将其他数据类型先自动转型为字符串,再连接:
1 | public class Main { |
多行字符串
如果我们要表示多行字符串,使用+号连接会非常不方便:
从Java 13开始,字符串可以用”””…”””表示多行字符串(Text Blocks)了。举个例子:
1 | public class Main { |
如果多行字符串的排版不规则,总是以最短的行首空格为基准。
不可变特性
String s = “hello”;时,JVM虚拟机先创建字符串”hello”,然后,把字符串变量s指向它:紧接着,执行s = “world”;时,JVM虚拟机先创建字符串”world”,然后,把字符串变量s指向它:原来的字符串”hello”还在,只是我们无法通过变量s访问它而已。因此,字符串的不可变是指字符串内容不可变。
理解了引用类型的“指向”后,试解释下面的代码输出:
1 | public class Main { |
空值null
引用类型的变量可以指向一个空值null,它表示不存在,即该变量不指向任何对象。例如:
1 | String s1 = null; // s1是null |
注意要区分空值null和空字符串””,空字符串是一个有效的字符串对象,它不等于null。
数组
定义一个数组类型的变量,使用数组类型 类型[]
,例如,int[]
。和单个基本类型变量不同,数组变量初始化必须使用new int[5]
表示创建一个可容纳5个int
元素的数组。
Java的数组有几个特点:
数组大小:数组变量.length
数组是引用类型,在使用索引访问数组元素时,如果索引超出范围,运行时将报错
在定义数组时直接指定初始化的元素,这样就不必写出数组大小,而是由编译器自动推算数组大小
对于数组ns来说,执行ns = new int[] { 68, 79, 91, 85, 62 };时,它指向一个5个元素的数组;再执行ns = new int[] { 1, 2, 3 };时,它指向一个新的3个元素的数组:但是,原有的5个元素的数组并没有改变,只是无法通过变量ns引用到它们而已。
字符串数组
1 | String[] names = { |
对names[1]进行赋值,例如names[1] = "cat";
,原来names[1]指向的字符串”XYZ”并没有改变,仅仅是将names[1]的引用从指向”XYZ”改成了指向”cat”,其结果是字符串”XYZ”再也无法通过names[1]访问到了。
相当于引用嵌套引用
遍历数组
方法1
1 | for (int i=0; i<ns.length; i++) { |
方法2: for each
循环
1 | int[] ns = { 1, 4, 9, 16, 25 }; |
变量n直接拿到ns数组的元素,而不是索引。
若想直接打印ns,可以这么做:System.out.println(Arrays.toString(ns));
排序数组
冒泡排序
Java的标准库已经内置了排序功能: Arrays.sort()
,例如:
1 | import java.util.Arrays; |
- 当我们调用
Arrays.sort(ns);
后,变量ns指向的数组内容已经被改变了- 如果对一个字符串数组(
String[] ns = { "banana", "apple", "pear" };
)进行排序,原来的3字符串在内存中均没有任何变化,但是ns数组的每个元素指向变化了
多维数组
例子
1 | public class Main { |
实际上arr1就获取了ns数组的第1个元素。因为ns数组的每个元素也是一个数组,因此,arr1指向的数组就是{ 5, 6, 7 }
遍历
1 | for (int[] arr : ns) { |
小结
命令行参数
Java程序的入口是main方法,而main方法可以接受一个命令行参数,它是一个String[]数组。
这个命令行参数由JVM接收用户输入并传给main方法:
1 | public class Main { |
我们可以利用接收到的命令行参数,根据不同的参数执行不同的代码。例如,实现一个-version参数,打印程序版本号:
1 | public static void main(String[] args) { |
上面这个程序必须在命令行执行,我们先编译它:
javac Main.java
然后,执行的时候,给它传递一个-version参数:java Main -version -version -test
I/O
输出
输出语句
System.out.println()
System.out.printf()
占位符
占位符 | 说明 |
---|---|
%d | 格式化输出整数 |
%x | 格式化输出十六进制整数 |
%f | 格式化输出浮点数 |
%e | 格式化输出科学计数法表示的浮点数 |
%s | 格式化字符串 |
注意,由于%表示占位符,因此,连续两个%%表示一个%字符本身。
占位符本身还可以有更详细的格式化参数。下面的例子把一个整数格式化成十六进制,并用0补足8位:
输入
import
语句导入java.util.Scanner
,import
是导入某个类的语句,必须放到Java源代码的开头
创建 Scanner
对象并传入 System.in。System.out
代表标准输出流,而System.in
代表标准输入流。直接使用System.in读取用户输入虽然是可以的,但需要更复杂的代码,而通过Scanner就可以简化后续的代码。
Scanner
对象后,要读取用户输入的字符串,使用scanner.nextLine()
,要读取用户输入的整数,使用scanner.nextInt()
。Scanner
会自动转换数据类型,因此不必手动转换。
例如:
1 | import java.util.Scanner; |
使用占位符构建字符串,并打印
1 | String <name> = String.format("%-10d%d", 20, 25) |
1 | { |
1 | { |
1 | { |
build
文件MinGW
地址,以及配置MinGW
,点击这里学会如何安装MinGW
,以及如何配置1 | { |
1 | { |
1 | { |
build
文件MinGW
地址,以及配置MinGW
,点击这里学会如何安装MinGW
,以及如何配置1 | // Set your c compiler if it is not working |