面试题系列:用了这么多年的 Java 泛型,我竟然只知道它的皮毛
面试题:说说你对泛型的理解?
面试考察点
考察目的:了解求职者对于Java基础知识的掌握程度。
考察范围:工作1-3年的Java程序员。
背景知识
Java中的泛型,是JDK5引入的一个新特性。
它主要提供的是编译时期类型的安全检测机制。这个机制允许程序在编译时检测到非法的类型,从而进行错误提示。
这样做的好处,一方面是告诉开发者当前方法接收或返回的参数类型,另一方面是避免程序运行时的类型转换错误。
泛型的设计推演
举一个比较简单的例子,首先我们来看一下ArrayList
这个集合,部分代码定义如下。
public class ArrayList{
transient Object[] elementData; // non-private to simplify nested class access
}
在ArrayList中,存储元素所使用的结构是一个Object[]
对象数组。意味着可以存储任何类型的数据。
当我们使用这个ArrayList来做下面这个操作时。
public class ArrayExample {
public static void main(String[] args) {
ArrayList al=new ArrayList();
al.add("Hello World");
al.add(1001);
String str=(String)al.get(1);
System.out.println(str);
}
}
运行程序后,会得到如下的执行结果
Exception in thread "main" java.lang.ClassCastException: java.lang.Integer cannot be cast to java.lang.String
at org.example.cl06.ArrayExample.main(ArrayExample.java:11)
这种类型转换错误,相信大家在开发中有遇到过,总的来说,在没有泛型的情况下,会有两个比较严重的问题
- 需要对类型进行强制转换
- 使用不方便,容易出错
怎么解决上面这个问题呢?要解决这个问题,就得思考这个问题背后的需求是什么?
我简单总结两点:
- 要能支持不同类型的数据存储
- 还需要保证存储数据类型的统一性
基于这两个点不难发现,对于一个数据容器中要存储什么类型的数据,其实是由开发者自己决定的。因此,为了解决这个问题,在JDK5中就引入了泛型的机制。
其定义形式是:ArrayList<E>
,它相当于给ArrayList
提供了一个类型输入的模板E
,E
可以是任意类型的对象,它的定义方式如下。
public class ArrayList<E>{
transient E[] elementData; // non-private to simplify nested class access
}
在ArrayList这个类的定义中,使用<>
语法,并传入一个用来表示任意类型的对象E
,这个E
可以随便定义,你可以定义成A
、B
、C
都可以。
接着,把用来存储元素的数组elementData
的类型,设置为E
类型。
有了这个配置之后,ArrayList
这个容器中,你想存储什么类型的数据,是由使用者自己决定,比如我希望ArrayList
只存储String
类型,那么它可以这么实现
public class ArrayExample {
public static void main(String[] args) {
ArrayList<String> al=new ArrayList();
al.add("Hello World");
al.add(1001);
String str=(String)al.get(1);
System.out.println(str);
}
}
在定义ArrayList
时,传入一个String
类型,这样写意味着后续往ArrayList
这个实例对象al
中添加元素,必须是String
类型,否则会提示如下的语法错误。
同理,如果需要保存其他类型的数据,可以这么写:
- ArrayList
- ArrayList
总结:所谓泛型定义,其实本质上就是一种类型模板,在实际开发中,我们把一个容器或者一个对象中需要保存的属性的类型,通过模板定义的方式,给到调用者来决定,从而保证了类型的安全性。
泛型的定义
泛型定义可以从两个维度来说明:
- 泛型类
- 泛型方法
泛型类
泛型类指的是在类名后面添加一个或多个类型参数,一个泛型参数,也被称为一个类型变量,是用于指定一个泛型类型名称的标识符。因为他们接受一个或多个参数,这些类被称为参数化的类或参数化的类型。
类型变量的表示标记,常用的是:E(element)
,T(type)
、K(key)
,V(value)
,N(number)
等,这只是一个表示符号,可以是任何字符,没有强制要求。
下面的代码是关于泛型类
的定义。
该类接收一个T
标记符的类型参数,该类中有一个成员变量,使用T
类型。
public class Response <T>{
private T data;
public T getData() {
return data;
}
public void setData(T data) {
this.data = data;
}
}
使用方式如下:
public static void main(String[] args) {
Response<String> res=new Response<>();
res.setData("Hello World");
}
泛型方法
泛型方法是指指定方法级别的类型参数,这个方法在调用时可以接收不同的参数类型,根据传递给泛型方法的参数类型,编译器适当地处理每一个方法调用。
下面的代码表示泛型方法的定义,用到了JDK提供的反射机制,来生成动态代理类。
public interface IHelloWorld {
String say();
}
定义getProxy
方法,它用来生成动态代理对象,但是传递的参数类型是T
,也就是说,这个方法可以完成任意接口的动态代理实例的构建。
在这里,我们针对IHelloWorld
这个接口,构建了动态代理实例,代码如下。
public class ArrayExample implements InvocationHandler {
public <T> T getProxy(Class<T> clazz){
// clazz 不是接口不能使用JDK动态代理
return (T) Proxy.newProxyInstance(clazz.getClassLoader(), new Class<?>[]{ clazz }, ArrayExample.this);
}
@Override
public Object invoke(Object proxy, Method method, Object[] args) throws Throwable {
return "Hello World";
}
public static void main(String[] args) {
IHelloWorld hw=new ArrayExample().getProxy(IHelloWorld.class);
System.out.println(hw.say());
}
}
运行结果:
Hello World
关于泛型方法的定义规则,简单总结如下:
- 所有泛型方法的定义,都有一个用
<>
表示的类型参数声明,这个类型参数声明部分在方法返回类型之前。 - 每一个类型参数声明部分包含一个或多个类型参数,参数间用逗号隔开。一个泛型参数,也被称为一个类型变量,是用于指定一个泛型类型名称的标识符。
- 类型参数能被用来声明返回值类型,并且能作为泛型方法得到的实际参数类型的占位符
- 泛型方法体的声明和其他方法一样。注意类型参数只能代表引用型类型,不能是原始类型(像 int、double、char 等)。##
多类型变量定义
上在我们只定义了一个泛型变量T,那如果我们需要传进去多个泛型要怎么办呢?
我们可以这么写:
public class Response <T,K,V>{
}
每一个参数声明符号代表一种类型。
注意,在多变量类型定义中,泛型变量最好是定义成能够简单理解具有含义的字符,否则类型太多,调用者比较容易搞混。
有界类型参数
在有些场景中,我们希望传递的参数类型属于某种类型范围,比如,一个操作数字的方法可能只希望接受Number或者Number子类的实例,怎么实现呢?
泛型通配符上边界
上边界,代表类型变量的范围有限,只能传入某种类型,或者它的子类。
我们可以在泛型参数上,增加一个extends
关键字,表示该泛型参数类型,必须是派生自某个实现类,示例代码如下。
public class TypeExample<T extends Number> {
private T t;
public T getT() {
return t;
}
public void setT(T t) {
this.t = t;
}
public static void main(String[] args) {
TypeExample<String> t=new TypeExample<>();
}
}
上述代码,声明了一个泛型参数T
,该泛型参数必须是继承Number
这个类,表示后续实例化TypeExample
时,传入的泛型类型应该是Number
的子类。
所以,有了这个规则后,上面这个测试代码,会提示java: 类型参数java.lang.String不在类型变量T的范围内
错误。
泛型通配符下边界
下边界,代表类型变量的范围有限,只能传入某种类型,或者它的父类。
我们可以在泛型参数上,增加一个super
关键字,可以设定泛型通配符的上边界。实例代码如下。
public class TypeExample<T> {
private T t;
public T getT() {
return t;
}
public void setT(T t) {
this.t = t;
}
public static void say(TypeExample<? super Number> te){
System.out.println("say: "+te.getT());
}
public static void main(String[] args) {
TypeExample<Number> te=new TypeExample<>();
TypeExample<Integer> te2=new TypeExample<>();
say(te);
say(te2);
}
}
在say
方法上声明TypeExample<? super Number> te
,表示传入的TypeExample
的泛型类型,必须是Number
以及Number
的父类类型。
在上述代码中,运行时会得到如下错误:
java: 不兼容的类型: org.example.cl06.TypeExample<java.lang.Integer>无法转换为org.example.cl06.TypeExample<? super java.lang.Number>
如下图所示,表示Number
这个类的类关系图,通过super
关键字限定后,只能传递Number
以及父类Serializable
。
类型通配符?
类型通配符一般是使用 ? 代替具体的类型参数。例如 List<?> 在逻辑上是 List
来看下面这段代码的定义,在say
方法中,接受一个TypeExample
类型的参数,并且泛型类型是<?>
,代表接收任何类型的泛型类型参数。
public class TypeExample<T> {
private T t;
public T getT() {
return t;
}
public void setT(T t) {
this.t = t;
}
public static void say(TypeExample<?> te){
System.out.println("say: "+te.getT());
}
public static void main(String[] args) {
TypeExample<Integer> te1=new TypeExample<>();
te1.setT(1111);
TypeExample<String> te2=new TypeExample<>();
te2.setT("Hello World");
say(te1);
say(te2);
}
}
运行结果如下
say: 1111
say: Hello World
同样,类型通配符的参数,也可以通过extends
来做限定,比如:
public class TypeExample<T> {
private T t;
public T getT() {
return t;
}
public void setT(T t) {
this.t = t;
}
public static void say(TypeExample<? extends Number> te){ //修改,增加extends
System.out.println("say: "+te.getT());
}
public static void main(String[] args) {
TypeExample<Integer> te1=new TypeExample<>();
te1.setT(1111);
TypeExample<String> te2=new TypeExample<>();
te2.setT("Hello World");
say(te1);
say(te2);
}
}
由于say
方法中的参数TypeExample
,在泛型类型定义中使用了<? extends Number>
,所以后续在传递参数时,泛型类型必须是Number
的子类型。
因此上述代码运行时,会提示如下错误:
java: 不兼容的类型: org.example.cl06.TypeExample<java.lang.String>无法转换为org.example.cl06.TypeExample<? extends java.lang.Number>
注意: 构建泛型实例时,如果省略了泛型类型,则默认是通配符类型,意味着可以接受任意类型的参数。
泛型的继承
泛型类型参数的定义,是允许被继承的,比如下面这种写法。
表示子类SayResponse
和父类Response
使用同一种泛型类型。
public class SayResponse<T> extends Response<T>{
private T ox;
}
JVM是如何实现泛型的?
在JVM中,采用了类型擦除Type erasure generics)
的方式来实现泛型,简单来说,就是泛型只存在.java源码文件中,一旦编译后就会把泛型擦除.
我们来看ArrayExample这个类,编译之后的字节指令。
public class ArrayExample implements InvocationHandler {
public <T> T getProxy(Class<T> clazz){
// clazz 不是接口不能使用JDK动态代理
return (T) Proxy.newProxyInstance(clazz.getClassLoader(), new Class<?>[]{ clazz }, ArrayExample.this);
}
@Override
public Object invoke(Object proxy, Method method, Object[] args) throws Throwable {
return "Hello World";
}
public static void main(String[] args) {
IHelloWorld hw=new ArrayExample().getProxy(IHelloWorld.class);
System.out.println(hw.say());
}
}
通过javap -v ArrayExample.class
查看字节指令如下。
public <T extends java.lang.Object> T getProxy(java.lang.Class<T>);
descriptor: (Ljava/lang/Class;)Ljava/lang/Object;
flags: ACC_PUBLIC
Code:
stack=5, locals=2, args_size=2
0: aload_1
1: invokevirtual #2 // Method java/lang/Class.getClassLoader:()Ljava/lang/ClassLoader;
可以看到,getProxy
在编译之后,泛型T
已经被擦除了,参数类型替换成了java.lang.Object.
并不是所有类型都会转换为java.lang.Object,比如如果是
,则参数类型是java.lang.String。
同时,为了保证IHelloWorld hw=new ArrayExample().getProxy(IHelloWorld.class);
这段代码的准确性,编译器还会在这里插入一个类型转换的机制。
下面这个代码是ArrayExample.class
反编译之后的呈现。
IHelloWorld hw = (IHelloWorld)(new ArrayExample()).getProxy(IHelloWorld.class);
System.out.println(hw.say());
泛型类型擦除实现带来的缺陷
擦除方式实现泛型,还是会存在一些缺陷的,简单举几个案例说明。
不支持基本类型
由于泛型类型擦除后,变成了java.lang.Object类型,这种方式对于基本类型如int/long/float等八种基本类型来说,就比较麻烦,因为Java无法实现基本类型到Object类型的强制转换。
ArrayList<int> list=new ArrayList<int>();
如果这么写,会得到如下错误
java: 意外的类型
需要: 引用
找到: int
所以,在泛型定义中,只能使用引用类型。
但是作为引用类型,如果保存基本类型的数据时,又会涉及到装箱和拆箱的过程。比如
List<Integer> list = new ArrayList<Integer>();
list.add(10); // 1
int num = list.get(0); // 2
在上述代码中,声明了一个List<Integer>
泛型类型的集合,
在标记1
的位置,添加了一个int
类型的数字10,这个过程中,会涉及到装箱操作,也就是把基本类型int
转换为Integer
.
在标记2
的位置,编译器首先要把Object转换为Integer类型,接着再进行拆箱,把Integer
转换为int
。因此上述代码等同于
List list = new ArrayList();
list.add(Integer.valueOf(10));
int num = ((Integer) list.get(0)).intValue();
增加了一些执行步骤,对于执行效率来说还是会有一些影响。
运行期间无法获取泛型实际类型
由于编译之后,泛型就被擦除,所以在代码运行期间,Java 虚拟机无法获取泛型的实际类型。
下面这段代码,从源码上两个 List 看起来是不同类型的集合,但是经过泛型擦除之后,集合都变为 ArrayList
。所以 if
语句中代码将会被执行。
public static void main(String[] args) {
ArrayList<Integer> li = new ArrayList<>();
ArrayList<Float> lf = new ArrayList<>();
if (li.getClass() == lf.getClass()) { // 泛型擦除,两个 List 类型是一样的
System.out.println("类型相同");
}
}
运行结果:
类型相同
这就使得,我们在做方法重载时,无法根据泛型类型来定义重写方法。
也就是说下面这种方式无法实现重写。
public void say(List<Integer> a){}
public void say(List<String> b){}
另外还会给我们在实际使用中带来一些限制,比如说我们没办法直接实现以下代码
public <T> void say(T a){
if(a instanceof T){
}
T t=new T();
}
上述代码会存在编译错误。
既然通过擦除的方式实现泛型有这么多缺陷,那为什么要这么设计呢?
要回答这个问题,需要知道泛型的历史,Java的泛型是在Jdk 1.5 引入的,在此之前Jdk中的容器类等都是用Object来保证框架的灵活性,然后在读取时强转。但是这样做有个很大的问题,那就是类型不安全,编译器不能帮我们提前发现类型转换错误,会将这个风险带到运行时。 引入泛型,也就是为解决类型不安全的问题,但是由于当时java已经被广泛使用,保证版本的向前兼容是必须的,所以为了兼容老版本jdk,泛型的设计者选择了基于擦除的实现。
问题解答
面试题:说说你对泛型的理解?
回答: 泛型是JDK5提供的一个新特性。它主要提供的是编译时期类型的安全检测机制。这个机制允许程序在编译时检测到非法的类型,从而进行错误提示。
问题总结
深入理解Java泛型是程序员最基础的必备技能,虽然面试很卷,但是实力仍然很重要。