RawVec
源-vec-raw.md Commit: e9335c82a2a73ad68f0516ff241c973dfa31ee16
我们遇到了一个很有意思的情况:我们把初始化缓存和释放内存的逻辑在Vec和IntoIter里面一模一样地写了两次。现在我们已经实现了功能,而且发现了逻辑的重复,是时候对代码做一些压缩了。
我们要抽象出(ptr, cap)
,并赋予它们分配、扩容和释放的逻辑:
struct RawVec<T> {
ptr: Unique<T>,
cap: usize,
}
impl<T> RawVec<T> {
fn new() -> Self {
assert!(mem::size_of::<T>() != 0, "TODO:实现零尺寸类型的支持");
RawVec { ptr: Unique::empty(), cap: 0 }
}
// 与Vec一样
fn grow(&mut self) {
unsafe {
let align = mem::align_of::<T>();
let elem_size = mem::size_of::<T>();
let (new_cap, ptr) = if self.cap == 0 {
let ptr = heap::allocate(elem_size, align);
(1, ptr)
} else {
let new_cap = 2 * self.cap;
let ptr = heap::reallocate(self.ptr.as_ptr() as *mut _,
self.cap * elem_size,
new_cap * elem_size,
align);
(new_cap, ptr)
};
// 如果分配或再分配失败,我们会得到null
if ptr.is_null() { oom() }
self.ptr = Unique::new(ptr as *mut _);
self.cap = new_cap;
}
}
}
impl<T> Drop for RawVec<T> {
fn drop(&mut self) {
if self.cap != 0 {
let align = mem::align_of::<T>();
let elem_size = mem::size_of::<T>();
let num_bytes = elem_size * self.cap;
unsafe {
heap::deallocate(self.ptr.as_mut() as *mut _, num_bytes, align);
}
}
}
}
然后像下面这样改写Vec:
pub struct Vec<T> {
buf: RawVec<T>,
len: usize,
}
impl<T> Vec<T> {
fn ptr(&self) -> *mut T { self.buf.ptr.as_ptr() }
fn cap(&self) -> usize { self.buf.cap }
pub fn new() -> Self {
Vec { buf: RawVec::new(), len: 0 }
}
// push/pop/insert/remove基本没变,只改变了:
// self.ptr -> self.ptr()
// self.cap -> self.cap()
// self.grow -> self.buf.grow()
}
impl<T> Drop for Vec<T> {
fn drop(&mut self) {
while let Some(_) = self.pop() {}
// 释放空间由RawVec负责
}
}
最后我们可以简化IntoIter:
struct IntoIter<T> {
_buf: RawVec<T>, // 我们并不关心这个,只是需要它们保持分配空间不被销毁
start: *const T,
end: *const T,
}
// next和next_back保持不变,因为它们并没有用到buf
impl<T> Drop for IntoIter<T> {
fn drop(&mut self) {
// 只需要保证所有的元素都被读到了
// 缓存会在随后自己清理自己
for _ in &mut *self {}
}
}
impl<T> Vec<T> {
pub fn into_iter(self) -> IntoIter<T> {
unsafe {
// 需要使用ptr::read非安全地把buf移出,因为它不是Copy,
// 而且Vec实现了Drop(所以我们不能销毁它)
let buf = ptr::read(&self.buf);
let len = self.len;
mem::forget(self);
IntoIter {
start: *buf.ptr,
end: buf.ptr.offset(len as isize),
_buf: buf,
}
}
}
}
现在看起来好多了。