C++学习笔记(下)
类
类的定义
类是用户自定义的类型,如果程序中要用到类,必须提前说明,或者使用已存在的类(别人写好的类、标准库中的类等),C++语法本身并不提供现成的类的名称、结构和内容。
class Student{
public:
//成员变量
char *name;
int age;
float score;
//成员函数
void say(){
cout<<name<<"的年龄是"<<age<<",成绩是"<<score<<endl;
}
};
- 类定义在”class”关键字之后,方法和属性的默认修饰符是”private”。
- 类定义在”struct”关键字之后,方法和属性的默认修饰符是”public”。
注意在类定义的最后有一个分号;
,它是类定义的一部分,表示类定义结束了,不能省略。
类只是一个模板(Template),编译后不占用内存空间,所以在定义类时不能对成员变量进行初始化,因为没有地方存储数据。只有在创建对象以后才会给成员变量分配内存,这个时候就可以赋值了。
在创建对象时,class 关键字可要可不要,但是出于习惯我们通常会省略掉 class 关键字,例如:
class Student LiLei; //正确
Student LiLei; //同样正确
除了创建单个对象,还可以创建对象数组:
Student allStu[100];
该语句创建了一个 allStu 数组,它拥有100个元素,每个元素都是 Student 类型的对象。
构造方法成员初始化
C++中构造方法初始化成员参数的方法有很多,可能大伙最熟悉的是直接在构造方法中初始化:
class Student{
std::string name;
int age;
public:
Student(){
name = "default";
age = 10;
}
};
而在C++中最方便的初始化方法其实是:
class Student{
std::string name;
int age;
public:
Student() : name("default"),age(10) {
}
};
在构造方法请求参数括号后 使用:
符号,按 成员参数名(值)来进行一一初始化。注意这里的赋值顺序需要按照成员参数的顺序,否则编译器会报错。
这种的构造器初始化的好处不仅仅只是为了便捷,最重要的是 不需要将初始化的值进行一次实例化,而是直接将值注入,提升了程序的性能。
举个例:
class Test{
public:
Test(){
std::cout << "This is default test!" << std::endl;
}
Test(std::string name){
std::cout << "This is " << name << " test!" << std::endl;
}
};
class Student{
Test test;
public:
Student(){
test = Test("My");
}
};
上面当调用Student空构造器函数后,看似会执行Test的有参构造器。但其实最终的输出是这样的:
This is default test!
This is My test!
因为Student中的test在初始化之前就触发了空参构造器,所以这种赋值会额外在内存中创建一个临时对象,浪费性能。
而使用上面的方式来初始化:
class Test{
public:
Test(){
std::cout << "This is default test!" << std::endl;
}
Test(std::string name){
std::cout << "This is " << name << " test!" << std::endl;
}
};
class Student{
Test test;
public:
Student() : test(Test("My")) { // 或者 test("My")
}
};
这种输出就只会输出:
This is My test!
析构函数
析构函数是 C++ 类的一个特殊成员函数,它在对象的生命周期结束时自动被调用,常常用于执行任何必要的清理操作。
析构函数的主要目的是释放对象可能已分配的资源,如动态内存、文件句柄、数据库连接等。
析构函数的声明如下:
class ClassName {
public:
~MyClass();
// ...
};
析构函数在以下情况下特别重要:
- 资源管理:当类的对象中 持有如动态内存、文件、网络连接等资源时,析构函数确保在对象销毁时释放这些资源。
- 与智能指针配合:例如,
std::unique_ptr
和std::shared_ptr
使用析构函数来确保所指向的对象在适当的时候被删除。
拷贝构造函数
拷贝行为通常发生在同类的赋值上。如下:
int a = 13;
int b = a; //b由a拷贝创建而来。
Person a = (XXX);
Person b = a; //同类的复制赋值,会触发拷贝构造函数。
同类的拷贝赋值行为 就会 触发类中的拷贝构造函数。定义这个函数后便可以自定义同类拷贝时的操作。
拷贝构造函数的典型声明如下:
class ClassName {
public:
ClassName(const ClassName& other);
// ...
};
其中,other
是要被复制的对象的引用。
注意事项:
深拷贝与浅拷贝:默认的拷贝构造函数执行浅拷贝,这可能不适用于具有动态分配内存或资源的类。在这种情况下,你需要提供自定义的拷贝构造函数来执行深拷贝。
规则 of Three/Five:如果你为类定义了拷贝构造函数、拷贝赋值运算符或析构函数,那么你通常也需要定义其他两个。这被称为 “Rule of Three”。在 C++11 及以后,这个规则扩展到五个,包括移动构造函数和移动赋值运算符,称为 “Rule of Five”。
删除拷贝构造函数:在某些情况下,可能不希望类的对象被拷贝赋值。那么,可以选择在类中删除拷贝构造函数:
ClassName(const ClassName& other) = delete; ... // ClassName a ClassName b = a; // Error
拷贝赋值运算符函数
与拷贝构造函数基本上含义一样,即拷贝同类函数,使用“ = ”赋值到另外一个同类对象上。
但两者区别是 拷贝赋值运算符 只是 作用于已经定义的对象上,而 拷贝构造函数则是生成一个未定义的对象。
Person a = (XXX);
Person b = a; //触发拷贝构造函数。
Person c;
c = a; //触发拷贝赋值运算符函数
拷贝赋值运算符函数的典型声明和定义如下:
class ClassName {
public:
ClassName& operator=(const ClassName& other) {
// 拷贝 other 的内容到 *this
return *this;
}
// ...
};
同样如果不期望触发拷贝赋值运算符操作的话,可以在类中删除它:
ClassName& operator=(const ClassName& other) = delete;
静态方法和静态成员变量
在 C++ 中,使用 static
关键字来声明一个静态成员函数。它是类的成员函数的一种特殊类型。静态方法属于整个类而不是类的实例,因此可以在不创建类的对象的情况下调用(前提该静态元素是在public访问修饰符下定义的)。
静态方法可以访问类的静态成员变量,但不能访问非静态成员变量,因为非静态成员变量是与类的实例相关联的。
非静态方法是可以访问类中的静态方法和静态变量的。
public的静态方法的调用方式是通过类名加作用域运算符 ::
来调用,而不是通过类的对象来调用。这意味着静态方法不需要通过类的实例进行调用。
class MyClass {
public:
static int staticVariable;
static void staticMethod() {
std::cout << "This is a static method." << std::endl;
}
}
int main(){
MyClass::staticVariable = 10;
MyClass::staticMethod();
return 0;
}
而位于非public下的静态成员(protected、private访问修饰符下),在外部不能直接访问,只能通过派生类、自身访问。
类的继承
C++的父类叫做基类,子类叫做派生类。当然叫做父类、子类都无关系,概率相同。
C++的类继承 是在派生类名后 使用:
。但和大多数语言不同的是 C++的类继承带有访问修饰符。默认未声明的情况下,即private继承。
class Base {
...
};
class DerivedPublic : public Base {
// public 继承,基类的 public 成员在派生类中保持 public 访问权限
};
class DerivedProtected : protected Base {
// protected 继承,基类的 public 成员在派生类中变为 protected 访问权限
};
class DerivedPrivate : Base {
// private 继承,默认继承方式, 基类的 public 成员在派生类中变为 private 访问权限
};
所以为了保证继承的结构相似性,基本上都是使用的public继承,额外加上public访问修饰符。
此外C++支持多重继承,这点和Python一样。
class Derived : public Base1, public Base2 {
// Derived 类继承了 Base1 和 Base2
};
需要注意的是,多重继承可能会引入一些问题,例如 “菱形继承“(Diamond Inheritance)问题。即继承的基类中出现重复的继承关系,它在类的继承关系中形成了一个菱形的结构,导致了一些二义性和资源浪费的情况。
class A {
public:
int x;
};
class B : public A {
public:
int y;
};
class C : public A {
public:
int z;
};
//基类B、C都继承于A类。相当于继承了两个A类。出现重复继承关系,即菱形继承。
class D : public B, public C {
public:
int w;
};
- 冗余数据:在类
D
中存在两份A
类的成员,造成了冗余的数据存储。 - 二义性:由于存在两份相同的成员
x
,当在类D
中访问x
成员时,编译器无法确定是从B
类部分还是C
类部分访问,从而导致了二义性。
为了解决菱形继承问题,C++ 提供了虚拟继承(virtual inheritance)的概念。通过在继承时使用 virtual
关键字,将其设定为虚拟继承,可以消除菱形继承引起的二义性问题,并确保在继承体系中只有一个共享的基类子对象。
class A {
public:
int x;
};
class B : public virtual A {
public:
int y;
};
class C : public virtual A {
public:
int z;
};
class D : public B, public C {
public:
int w;
};
这样在类 D
中只会有一个共享的 A
类子对象。此时访问 x
成员时就不会出现二义性。虚拟继承确保了基类 A
在继承体系中只有一份共享的拷贝,从而避免了冗余数据的问题。就虚函数一样,虚拟继承也会生成一个虚拟表(vtable)来处理虚拟继承的问题,会造成内存需求上升。但正常情况开发下,这点性能损失可以忽略不计。
虚函数 和重写- virtual、override
C++中要实现继承子类中,重写父类的方法 ,即方法重载。就得将 对应父类方法进行虚函数设置:
在方法前加上修饰符 virtual
,表名该函数为虚函数,子类可对其进行重写操作。
和其他语言,like Java相似,子类方法在进行重写操作时需要添加 override修饰符。C++的override修饰符置于方法()后,它不是硬性要求,只是对其IDE进行识别。
class Person {
public:
// 虚函数,该方法可被后代重写
virtual void doSomething(){
std::cout << "Person" << std::endl;
};
};
class Techer : public Person{
public:
// override修饰符,IDE识别该方法为重写方法。非硬性要求。
void doSomething() override {
std::cout << "Techer" << std::endl;
};
};
使用虚函数,编译器会生成一个虚拟表(vtable)来处理虚函数的处理,会造成内存需求上升。但正常情况开发下,这点性能损失可以忽略不计。
单例模式
C++中的单例模式设计如下:
class Singleton
{
private:
// 阻止直接创建
Singleton()
{
}
float IFloat()
{
return m_Xxx;
}
float m_Xxx = 0.5f;
public:
static Singleton& getInstance()
{
static Singleton instance; //将单例实体放置在获取方法中,而不是常规的private中,并没有实际影响。
return instance;
}
// 移除赋值修饰符
Singleton(const Singleton&) = delete;
// 单例方式静态直接调用内部方法
static float Float() { return getInstance().IFloat(); }
};
int main()
{
Singleton& singleton = Singleton::getInstance(); //单例方式获取的是引用
float s = Singleton::Float();
}
接口-interface
C++中没有像JAVA这种语言内置有Interface类型。在 C++ 中,你可以使用抽象类和纯虚函数来定义接口。接口是一种规范,它定义了一组方法(成员函数)的名称和参数列表,但没有实际的实现。具体的类可以通过继承接口并实现其中的纯虚函数来实现接口的功能。所以纯虚函数构成的类即接口类。
所谓纯虚函数,就是函数声明 为 0的虚函数,like virtual ReturnType functionName(XXX) = 0
。
下面是在 C++ 中编写接口的基本步骤:
- 定义接口类:创建一个抽象类,其中包含一组纯虚函数,这些纯虚函数将组成接口的方法。在 C++ 中,通过在函数声明后面添加
= 0
来将其定义为纯虚函数。 - 继承接口类:创建具体的类,并继承上述定义的接口类。在具体类中,必须实现接口类中的所有纯虚函数,否则具体类也将成为抽象类。
#include <iostream>
// 定义接口类
class Interface {
public:
virtual void doSomething() = 0; // 纯虚函数,构成接口
virtual void doAnotherThing() = 0; // 纯虚函数,构成接口
};
// 具体类A,实现了接口类Interface
class ClassA : public Interface {
public:
void doSomething() override {
std::cout << "ClassA: Doing something." << std::endl;
}
void doAnotherThing() override {
std::cout << "ClassA: Doing another thing." << std::endl;
}
};
// 具体类B,实现了接口类Interface
class ClassB : public Interface {
public:
void doSomething() override {
std::cout << "ClassB: Doing something." << std::endl;
}
void doAnotherThing() override {
std::cout << "ClassB: Doing another thing." << std::endl;
}
};
int main() {
ClassA objA;
ClassB objB;
Interface* ptrA = &objA;
Interface* ptrB = &objB;
// 通过指向接口的指针调用具体类的方法,实现了多态
ptrA->doSomething();
ptrB->doAnotherThing();
return 0;
}
命名空间-namespace
namespace
是一种用于组织代码和避免命名冲突的机制。它允许将一组相关的函数、类、变量等定义在一个逻辑上独立的命名空间中,从而将它们与其他代码隔离开来。从用在h头文件中。
通过使用 namespace
,你可以在代码中创建一个新的命名空间,并在该命名空间中定义函数、类、常量等,这些定义将会放在这个命名空间中。这样可以避免在全局作用域中产生命名冲突,同时也提供了更好的代码组织和模块化。
namespace name {
// 命名空间内的代码定义
// 可以包含函数、类、常量等
}
使用案例
命名空间常常使用在h头文件中,用来将相关代码组织在一起:当你有一组相关的函数、类、常量等,可以将它们放在同一个命名空间中,使代码更加结构化和清晰。并且避免了调用多个库而导致函数冲突的情况。
// ModuleA.h
namespace ModuleA {
void func();
}
// ModuleB.h
namespace ModuleB {
void func();
}
// main.cpp
#include "ModuleA.h"
#include "ModuleB.h"
int main() {
ModuleA::func();
ModuleB::func();
return 0;
}
namespace使用 命名空间名称+::
+对应 变量和函数。
int main() {
A::func();
B::func();
return 0;
}
使用using namespace
由于include导入了含有namespace定义的h头文件,在调用对应namespace的函数时,我们不得不在函数前加上 命名空间名::
,like std::cout
、std::string
。
为了方便,可以使用using namespace 命名空间名,让c++编译器默认使用该namespace中的对应函数,从而不需要使用 前置”命名空间名::”调用对应函数了。
using namespace std;
int main(){
cout << "Hello,world" << endl;
}
using 操作符 遵守作用域,如果将其定义在局部作用域下,那么范围将只作用在作用域下。
C++内存区域
C++的内存区域主要有4个。
分别是:
- 栈内存 (局部变量和函数调用的内存区域,C++自动管理)
- 堆内存(
new
操作符在堆上手动分配内存,由程序员代码手动管理) - 全局/静态存储区(全局变量、静态变量和常量,在程序整个生命周期内都一直存在)
- 常量存储区(存储字符串常量和其他常量数据,在程序整个生命周期内都一直存在)
栈内存(Stack Memory)
栈内存(Stack Memory)的特点:
- 栈内存是用于存储局部变量和函数调用的内存区域。
- 在程序运行时,每个线程都会维护一个称为”栈”的内存空间。
- 函数调用过程中,函数的局部变量和参数会被分配在栈上,并在函数调用结束时自动释放。
- 栈内存的分配和释放是由编译器自动完成的,它的速度很快,因为栈上的内存分配和释放遵循后进先出(LIFO)的原则,只需简单地移动指针即可完成。
- 栈的大小通常有限,一般在几MB到几GB之间,具体取决于系统和编译器设置。这意味着栈上分配的内存不适合存储大型对象或长期存活的对象。
在C++代码中,栈内存主要体现在以下几个方面:
局部变量:在函数或代码块内部声明的变量都被视为局部变量,并且这些变量通常存储在栈上。当函数或代码块执行完毕时,栈上的局部变量会自动被销毁,其内存被释放。这种自动的内存管理确保了局部变量在其作用域内有效,且不会产生内存泄漏。
#include <iostream> void myFunction() { int x = 10; // x是一个局部变量,存储在栈上 std::cout << "x: " << x << std::endl; } // 在函数执行完毕后,x会被自动销毁
函数调用和返回:函数调用过程中,函数的返回地址和局部变量等信息被保存在栈帧中。当函数执行完毕后,栈帧会被弹出,将控制权返回给调用函数。
int main() { int sum = add(5, 3); // add函数调用时,sum和add函数的返回地址等信息被保存在栈帧中 std::cout << "Sum: " << sum << std::endl; // 栈帧被弹出,控制权返回给main函数 }
在这些场景中,栈内存的分配和释放是自动管理的,无需程序员手动干预,这样可以确保内存的正确使用和释放,避免了很多内存管理问题。然而,需要注意栈内存的有限性,特别是在处理递归或大型数据结构时,可能会导致栈溢出错误。
堆内存(Heap Memory)
堆内存(Heap Memory)的特点:
- 堆内存用于存储动态分配的数据,它的分配和释放是由程序员手动控制的。
- 堆内存提供了更大的内存空间,用于存储对象和数据结构,其大小受系统内存的限制。
- 在堆上分配内存需要使用特定的操作符,如
new
(在C++)或malloc
(在C语言)来请求内存空间。 - 释放堆内存需要使用
delete
(在C++)或free
(在C语言)来手动释放已分配的内存,以避免内存泄漏。 - 堆上的内存分配和释放比栈内存更慢,因为它需要更复杂的内存管理操作。但是堆内存允许对象的生存期在函数调用之外,因此可以在堆上存储长期生存的对象。
在C++代码中,栈内存主要体现在:
在C++中,我们可以使用new
操作符来在堆上分配内存,使用delete
操作符来释放已分配的内存。
#include <iostream>
int main() {
// 在堆上动态分配一个整数
int* pInt = new int;
*pInt = 10;
std::cout << "Value at pInt: " << *pInt << std::endl;
// 在堆上动态分配一个整数数组
int* pIntArray = new int[5];
for (int i = 0; i < 5; ++i) {
pIntArray[i] = i;
}
delete pInt;
delete[] pIntArray;
}
需要注意的是,堆内存的分配和释放是比较慢的,因为它涉及到更复杂的内存管理。因此,在使用堆内存时,应该仔细考虑何时分配和释放内存,以避免不必要的内存分配和泄漏。
推荐在使用堆内存时,使用智能指针(如std::unique_ptr
和std::shared_ptr
)等RAII(资源获取即初始化)技术来自动管理内存,以确保在不再需要时自动释放内存,避免忘记手动释放内存的问题。
栈内存和堆内存总结
栈内存和堆内存是程序运行时内存分配的两个主要区域。栈内存用于存储局部变量和函数调用的内存区域,其分配和释放由编译器自动管理,速度较快但容量有限。堆内存用于动态分配数据,其分配和释放由程序员手动控制,允许存储较大的对象和长期生存的对象,但速度较慢。正确地管理栈内存和堆内存对于程序的性能和稳定性至关重要。
全局/静态存储区
- 全局存储区用于存储全局变量、静态变量和常量。
- 在程序的整个生命周期内都存在,即从程序启动到程序结束,这些变量的值保持不变。
- 全局变量和静态变量在程序开始运行时被初始化,而常量在编译时被确定。
#include <iostream>
// 全局变量
int globalVar = 10;
// 静态变量
static int staticVar = 20;
void func() {
// 静态局部变量
static int count = 0;
count++;
std::cout << "Count: " << count << std::endl;
}
int main() {
// 常量
const int constantVar = 30;
std::cout << "Global Variable: " << globalVar << std::endl;
std::cout << "Static Variable: " << staticVar << std::endl;
std::cout << "Constant Variable: " << constantVar << std::endl;
func(); // 调用func函数多次,静态局部变量的值会一直增加
return 0;
}
常量存储区
- 常量存储区用于存储字符串常量和其他常量数据。
- 在程序的整个生命周期内都存在,其值在编译时就已经确定,不可更改。
#include <iostream>
int main() {
const char* str = "Hello, World!"; // 字符串常量
std::cout << str << std::endl;
return 0;
}
全局/静态存储区与常量存储区 区别
全局/静态存储区 的内容 在程序运行前初始化为0,而常量存储区 的内容在编译时就已经确定,不可在运行时修改。
重载new操作符
new
是一个关键字,和sizeof
一样,我们无法修改其具体功能。new
主要做三件事:分配空间、初始化对象、返回指针。调用operator new
分配空间。
但其实new在堆内存中分配内存,实际上是调用的C语言中的 malloc函数。在很多情况下,我们可以重载new操作符,并加上分配堆内存大小Log操作,方便为某些操作做对应的优化。
void* operator new(size_t size)
{
std::cout << "堆内存中分配了内存,大小为:" << size << "个字节\n";
return malloc(size);
}
每当有操作调用new,在堆内存中分配内存时,它都会打印出分配的大小。当然使用智能指针也同样会触发new操作。
重载delete重载符
delete的本质也是调用了free函数。和重载new操作符一样。我们也可以重载delete操作符。
void operator delete(void* memory, size_t size)
{
std::cout << "堆内存中释放了内存,大小为:" << size << "个字节\n";
free(memory);
}
统计堆内存中的使用量
利用上重载new重载符和delete操作符后,可以编写一个struct or class,并利用静态static全局创建,来动态统计当前堆内存中的使用量:
struct AllocationMetrics
{
uint32_t TotalAllocated = 0;
uint32_t TotalFreed = 0;
uint32_t CurrentUsage() { return TotalAllocated - TotalFreed; }
}
static AllocationMetrics s_AllocationMetrics; // 创建AllocationMetrics全局对象
void* operator new(size_t size)
{
s_AllocationMetrics.TotalAllocated += size; //每次分配在堆内存中分配内存大小统计
return malloc(size);
}
void* operator new[](std::size_t size) {
s_AllocationMetrics.TotalAllocated += size;
return std::malloc(size);
}
void operator delete(void* memory, size_t size)
{
s_AllocationMetrics.TotalFreed += size; //每次清除堆内存大小统计
free(memory);
}
void operator delete[](void* memory, std::size_t size) noexcept {
s_AllocationMetrics.TotalFreed += size;
std::free(memory);
}
static void printMemoryUsage()
{
std::cout << "堆内存使用情况:" << s_AllocationMetrics.CurrentUsage() << "个字节\n";
}
创建了一个AllocationMetrics struct ,当每次调用 new 和delete 进行堆内存操作时都进行统计。调用printMemoryUsage函数即可打印当前堆内存情况。
int main()
{
printMemoryUsage();
std::string string = "ZSSAER";
printMemoryUsage();
{
std::unique_ptr<XXX> xxx = std::make_unique<XXX>();
printMemoryUsage();
}
printMemoryUsage();
}
字符串
C的字符串其实是由单个字符构成,实现字符串的原理就是创建字符的数值。
char str1[30] = {"XXX"};
char str2[] = "XXX"; //这种形式更加简洁,实际开发中常用
在C语言中,字符串总是以'\0'
作为结尾,所以'\0'
也被称为字符串结束标志,或者字符串结束符。(这个\0也会占字符大小,所以定义字符串的大小的时也要size+1)
'\0'
是 ASCII 码表中的第 0 个字符,英文称为 NUL,中文称为“空字符”。该字符既不能显示,也没有控制功能,输出该字符不会有任何效果,它在C语言中唯一的作用就是作为字符串结束标志。
上面创建的str1和str2字符串实际上 在结尾处都自动补充上来”\0”,它们实际上 是存储的是“XXX\0”。
字符串长度计算函数strlen
实际是以\0
为结尾来计算的,所以当字符串中中间包含\0
时,那么只能计算\0
前面的字符长度:
#include <stdio.h>
#include <stdlib.h>
int main(){
char str[] = "xx\0xxx";
long len = strlen(str); \\ 2
}
创建方式
C++的字符串创建通常有下面几种:
字符数组/字符串指针创建方式:
你可以使用字符数组来创建字符串,数组以空字符\0
结尾,表示字符串的结束。例如:const char str1[] = "Hello, World!";
[]
中不包含大小时,会默认根据初始化的字符大小来设置。加入const的目的是保证字符串作为常量,确保字符串后续不能被修改。
为了更好的动态内存分配和灵活性,实际上通常使用字符串指针创建。
const char* str1 = "Hello, World!"
C++ 字符串类
std::string
:
C++ 标准库提供了std::string
类,它封装了字符串的处理操作,并自动管理内存。你可以使用以下方式创建std::string
对象:std::string str2 = "Hello, World!";
使用
std::string
构造函数:
你可以使用std::string
类的构造函数来创建字符串,接受不同类型的参数,例如:std::string str3("Hello, World!"); // 从 C 风格字符串创建 std::string str4(10, 'A'); // 重复字符 'A' 10 次
使用字符串连接运算符
+
:
你可以通过连接两个字符串来创建一个新的字符串,使用+
运算符来实现:std::string str5 = "Hello, "; std::string str6 = "World!"; std::string result = str5 + str6;
使用字符串字面量:
在 C++11 及以上版本中,你可以使用原始字符串字面量来创建字符串,它以R
开头,并使用括号括起来,方便处理包含多行和转义字符的字符串:std::string str7 = R"(This is a raw string literal \n Hello)";
无论你选择哪种方式,实际上字符串都会在字符串尾部加上结束符 \0
,这是 C 风格字符串的要求。
const char* str = "XXX";
char* str1 = "xxx";
上述两个字符串看看起来都是一样的,第一个是使用字符串指针创建的字符串常量,而第二个则只是由字符串指针创建的字符串。
顾名思义,str这个字符串常量定义后肯定不能被后续修改。但是对于str1这个字符串呢?
其实str1看起来并未被标记为常量,是能被后续修改的,但记住 使用指针创建的字符串只是指向一段字符串的,你依然不能后续修改它。由于缺少const标记,一些IDE不会显示后续修改操作错误。但是某些C++编译器则会出现异常。所以通常情况下都是使用的const char*创建方式。
所有的字符串,都是通过在堆内存中进行分配内存大小实现的,而左值的对象是通过 对其的指针。所以创建字符串都相当于调用new操作,在堆内存中分配了内存空间。所以字符串使用都会造成程序运行效率变低。
但在C++11中,使用std::string
创建小于等于15字符的字符串,在Release编译模式下,会自动开启一种叫SSO小字符串优化操作,会将小字符串直接在栈缓存中直接创建,而不再在堆内存中创建。所以对于16以下字符大小的字符串不需要特别在意其对程序的运行效率影响。
库的 静态链接 / 动态链接
和其他语言一样,编写C++项目也会面临使用很多第三方的库。所谓库,就是写好的现有的,成熟的,可以复用的代码。现实中每个程序都要依赖很多基础的底层库,不可能每个人的代码都从零开始,因此库的存在意义非同寻常。
本质上来说库是一种可执行代码的二进制形式,可以被操作系统载入内存执行。库有两种:静态库(.a、.lib)和动态库(.so、.dll)。
所谓静态、动态是指链接。将一个程序编译成可执行程序的步骤:
简而言之,库的使用有两种(即库的连接方式):
- 静态链接:使用静态库(.a、.lib),在是因为在链接阶段,会将汇编生成的目标文件(.o)与引用到的库(.a、.lib)一起链接打包到可执行文件中。因此对应的链接方式称为静态链接。 使用的库也会被打包在一个可执行文件中,运行不需要外置dll文件。
- 动态链接:使用动态库(.so、.dll),动态库在程序编译时并不会被连接到目标代码中,而是在程序运行是才被载入。
两种链接方式的优缺点:
静态链接:通常这种方式打包生成的可执行文件往往比较大,空间浪费。但是由于不需要动态获取外置库内容,所以程序运行效率高于动态链接。
动态链接:不同的应用程序如果调用相同的库,那么在内存里只需要有一份该共享库的实例,规避了空间浪费问题。动态库在程序运行是才被载入,也解决了静态库对程序的更新、部署和发布页会带来麻烦。用户只需要更新动态库即可,增量更新。
静态链接方法
以使用GLFW(一个OpenGL的开源库)为例,官网下载对应的二进制包。
我们要使用的是 将其中 include文件夹(内含h头文件,表示该库可以调用内容),一个lib二进制文件夹(内含lib静态库文件,库种核心文件)。
结构如下:
include\
GLFW\
glfw3.h
GLFW\
glfw3.lib
glfw3dll.lib
glfw3.dll
在解决方案文件夹下创建一个dependencies文件夹,用于放置第三方库文件,将上面两个文件夹放置进去。
VS设置解决方案属性中,在“C/C++”选项中,将include文件导入附加包含目录中:
注意这里使用$(SolutionDir),避免使用绝对地址。以免其他电脑使用项目配置出错。
将包含h头文件的目录配置进包含目录中后,这时IDE就能顺利识别到该库的h文件了,便可以在自己项目中include使用了。
#include <iostream>
#include <GLFW/glfw3.h>
int main() {
int g = glfwInit();
std::cout << g << std::endl;
std::cin.get();
return 0;
}
这里由于include文件下还有一级GLFW文件夹,所以导入的是GLFW/glfw3.h
。为什么,不再C++附加包含目录中直接配置到include下面的GLFW文件夹呢?
因为在程序中不一定只会包含这一个第三方库,所以只导入include,后续单独加上各种库的文件夹,这种方式更符合规范。
按Ctrl+F7编译,VS提示成功后,执行生成操作时,会弹出错误。这是因为h头部文件只是一个声明库 中可调用函数的文件,不包含其中函数的内部操作代码部分(相当于一个只是Java中的接口)。相当于第三方库函数调用内容是空的,在链接时自然会提示报错。
我们需要在将库的核心 静态库文件导入进来。在VS设置解决方案属性中,在“连接器”选项下的“常规”选项中,在附加库目录中 添加lib二进制文件夹:
然后到”输入”选项卡中,在附加依赖性 中添加 使用的lib文件:
这里由于在附加库目录中添加了文件夹地址,所以这里直接输入文件名即可被链接器寻找到。
这时,再重新执行生成操作,就会发现被成功的链接上了。生成的可执行文件由于静态链接的原因 也变大了不少。
自此便成功使用静态链接方法使用了第三方GLFW的静态库(.lib、.a)。
动态链接方法
所谓动态链接,即在程序运行过程中加载外部动态dll库。所以dll文件需要放置在可执行文件旁,这种方式常用于大型项目中。
步骤基本上静态类似。
类似的添加C++ 附加包含目录,以便寻找h头文件。
类似的添加链接器中的 附加依赖项。但不同的是需要添加对于的动态库文件,而不是静态库文件,GLFW中动态库文件是glfw3dll.lib
,不然编译链接将依然按照静态链接处理。
生成解决方案后,动态链接的项目不能直接运行,这时运行的话会提示程序找不到XXX.dll文件。我们需要额外的将其动态库文件dll放置在生成的可执行文件旁才可以运行。
如果时动态库也是一个自己的项目,需要不断更新修改的话,那么相当于每次都需要再把最新的动态库Dll文件拷贝过来。
为了简便流程,我们可以在主项目中设置生成后自动复制动态库操作。
打开主项目的属性页。打开“生成事件”下的“生成后事件”选项卡,在其命名行中 加入以下内容:
xcopy /y /d "动态库项目地址\$(IntDir)动态库名.dll" "$(OutDir)"
xcopy /y /d "..\MathLibrary\$(IntDir)MathLibrary.dll" "$(OutDir)" // 复制相对路径下上级文件夹下的MathLibrary下的对应编辑生成地址中的MathLibrary.dll到本项目输出目录下
这里的动态库项目地址如果也在同一个仓库中,可以就近使用相对路径”../“方式。“$(IntDir)”函数将自动寻找编译生成的地址。
模板(Template)
C++中的Template类似于C#、Java语言中的泛型。但是它不至于泛型限制的作用,功能更加强大,可以用来在程序编译中生成对应的代码。
C++ 模板(Template)是一种通用的编程机制,允许在编译时根据类型参数生成通用的代码。通过使用模板,可以实现一次编写多次使用的代码,从而提高代码的重用性和灵活性。C++ 模板使得模板元编程成为可能,这是一种使用模板在编译时执行计算的技术,从而产生更高效的代码。
模板的使用
C++ 中的模板主要分为两种类型:
函数模板(Function Template):函数模板允许定义通用的函数,其中的某些类型或值是参数化的。函数模板使用
template
关键字来声明,并使用一个或多个模板参数来表示参数化的类型或值。template <typename T> T max(T a, T b) { return (a > b) ? a : b; } ... max(12,13); //根据函数参数,编译器自动将其T设定为int类型 max(12.3,13.5); //根据函数参数,编译器自动将其T设定为double类型 max<float>(12.3f,13.5f) //手动设置T为float类型,函数参数必须要求float类型。
其中
中的typename 可替换为class。T即泛型的变量名,可根据实际自由更改命名。位于模板下方的函数使用模板中的泛指自动 将其函数标记为函数模板。 类模板(Class Template):类模板允许定义通用的类,其中的某些成员或成员函数是参数化的。类模板也使用
template
关键字来声明,并使用一个或多个模板参数来表示参数化的类型或值。template <typename T> class Stack { private: T arr[100]; int top; public: Stack() : top(-1) {} void push(T val) { arr[++top] = val; } T pop() { return arr[top--]; } bool isEmpty() const { return top == -1; } };
上述代码定义了一个类模板
Stack
,它是一个栈结构,其中的元素类型是模板参数T
。在使用时,可以根据不同的类型来实例化不同类型的栈对象。
模板中的泛型不只是可以定义一个,可以定义更多:
template <typename T, typename N, int O> //T和N都接受任何类型元素,而O只能接受int类型元素。
T function(T a, N b, O c)
{
...
}
对于指定了类型的元素,相当起到了替换作用。
C++ 模板还可以与 STL 容器和算法一起使用。标准模板库(STL)提供了许多通用容器,如 std::vector
、std::map
等,可以处理任何数据类型。
可变函数模板
可变模板参数是 C++11 引入的一个功能,允许模板接受任意数量和类型的参数。这为模板编程提供了更大的灵活性,特别是在需要处理不确定数量的类型时。
template<typename... Args>
void myFunction(Args... args);
可变模板参数使用省略号 ...
来表示。 虽然使用可变模板参数,但是仍然需要在 参数类型定义中和 参数使用时添加”…”。
递归使用:
和可变函数原因,一般可变函数模板单独出现,至少还有一个参数。可变函数模板,常用作构建递归函数,并且还要 重载一个函数的模板函数 。:
// 当递归到只有一个参数的时候
template<typename T>
void print(T t) {
std::cout << t << std::endl;
}
template<typename T, typename... Args>
void print(T t, Args... args) {
std::cout << t << std::endl;
print(args...);
}
int main() {
print(1, 2.2, "three", '4');
}
上面函数模板是一个万用类型打印函数。
通常可变函数模板中,要有一个常规参数,用作处理单独事物。而可变函数是不能用来直接处理的,只能用来递归。递归还需要再重载一个无可变参数的模板,用以最后递归 的调用。
结合 sizeof...
运算符使用:
C++11 还引入了 sizeof...
运算符,它可以用来直接计算可变模板参数的数量:
template<typename... Args>
void printCount(Args... args) {
std::cout << sizeof...(Args) << std::endl; // 计算类型数量
std::cout << sizeof...(args) << std::endl; // 计算参数数量
}
int main() {
printCount(1, 2.2, "three", '4'); // 输出 4 两次
return 0;
}
预处理
C++ 预处理(Preprocessor)是 C++ 编译过程中的一个重要阶段,它在实际编译之前对源代码进行一系列文本替换和宏展开等处理。预处理器的主要任务是处理以井号 #
开头的预处理指令,并根据这些指令对源代码进行修改和处理,生成预处理后的代码。其中我们常用的开头编写的 #include就是一个预处理命名。
这些预处理指令是由编译器在编译之前处理的,所以称为预处理。它的优先级高于 普通编写的代码。
预处理器的工作是在实际的编译过程之前进行的,它会对整个源代码进行处理,并生成一个新的经过宏展开和文本替换的临时代码文件。这个临时文件会被传递给编译器进行后续的编译和生成目标代码。
预处理器常见的指令包括:
#include
:用于包含其他头文件。#define
:用于定义宏。#ifdef
、#ifndef
、#else
、#endif
:用于条件编译。#ifdef
、#ifndef
、#else
、#elif
、#endif
:用于条件编译。#pragma
:用于给编译器传递特定的编译指令。
预处理器还支持宏替换、宏展开等功能。宏是一种简单的文本替换,可以用 #define
定义宏,并在代码中使用。预处理器会在编译之前将宏展开为其对应的文本,从而实现宏的替换功能。
#define
对于反复使用的代码,可以使用#define
预处理命名来 用指定语句 代替。
#define CIN_GET std::cin.get()
#define LOG(X) std::cout << X << std::endl
...
int i = 1;
LOG(i); // as std::cout << i << std::endl
CIN_GET; // as std::cin.get()
#define 宏名 代替语句
使用define来代替一些语句的方式,是C++ 宏的一种常用的形式。
对于多行的语句,显然 #define 不能直接接受换行内容。
只需要在每个换行前 加上反斜杠符号 \
(Enter换行的转义),预处理器就能将其归纳为一个预处理语句下的内容了。
#define MAIN int main() { \
std::cin.get();\
}
#ifdef
#ifdef
是预处理指令之一,用于条件编译,需要于#endif
一起使用。它的作用是在编译阶段根据条件来判断是否包含或排除某些代码块,从而实现根据不同情况选择性地编译特定的代码片段。
#ifdef 宏名
// 条件为真时要编译的代码
#endif
预处理将会自动寻找相关宏名,它们可以是在文件中使用#define定义的,也可以是在编译器的命令行参数或者IDE的预处理器中定义的。如果宏名存在或者返回 真则 执行后续内容,否则不执行后续,跳转到#endif下。
VS中预处理器定义 设置在 解决方案设置下。
下面是一段简单的例子:
#include <iostream>
#ifdef DEBUG_MODE
#define NOW_MODE std::cout << "In debug mode now." << std::endl
#else
#define NOW_MODE std::cout << "In release mode now." << std::endl
#endif
int main() {
NOW_MODE;
std::cin.get();
return 0;
}
上面的DEBUG_MODE 需要在 IDE中的预处理器定义 中在DEBUG模式下设置。 上面当程序编译位于不同模式下,NOW_MODE宏都会有不同的定义。
另外预处理语句同样 也可以位于普通代码的内部,并非限制于文件头部位置。
int main() {
#ifdef DEBUG_MODE
std::cout << "Debug mode is enabled." << std::endl;
#else
std::cout << "Debug mode is disabled." << std::endl;
#endif
return 0;
}
同样类似于#ifdef
的条件预处理语句还有 如 #ifndef
、#else
、#elif
、#endif
等,使用方法大差不差。
# if
上面简绍的#ifdef
有个缺陷,就是只能接受宏名,不能判断对应的参数。
而#if
则更加合理。
#if DEBUG_MODE == 1
#define NOW_MODE std::cout << "In debug mode now." << std::endl
#else
#define NOW_MODE std::cout << "In release mode now." << std::endl
#endif
这里在 IDE中的预处理器定义 中在DEBUG模式下设置 DEBUG_MODE=1
即可(中间不能有空格)。
#if
能判断值,让人更加理解,而#ifdef
只能单纯判断宏的存在与否。
线程-Thread
在C++ 11之前,C++ 标准库并没有提供线程支持。
但从 C++11 开始,标准库引入了 <thread>
头文件,为多线程编程提供了原生支持。这使得在 C++ 中创建和管理线程变得相对简单。
创建线程
使用 std::thread
类可以创建一个新的线程。你只需提供一个函数或可调用对象,它将在新线程中执行。
#include <iostream>
#include <thread>
void myFunction() {
std::cout << "Hello from thread!" << std::endl;
}
int main() {
std::thread t(myFunction); // 对象名(线程操作函数 or 可调用对象)
t.join(); // 等待线程完成
return 0;
}
thread除了提供已经有的函数以外,可以提供lambda函数。
运行线程 和 结束线程
和Java等语言那种需要手动调用start方法来 启动线程操作 不一样。
C++ 中创建的Thread线程对象是自动启动的,不需要手动调用方法启动。
在结束方面,也会Java等语言不同。C++中 Thread需要额外声明它的结束,否则运行完毕的Thread将不会被内存清理,就如同在堆内存中创建对象需要 delete一样。
通常需要附加上 join(同步结束) 、 detach(异步结束),这取决于对该线程的运行要求。
等待线程(同步) - join
用于现代CPU都是多核心多线程,所以现代程序 默认情况下不同线程操作是同时运行的,各自不会等待,称之为异步。
当某些场景需要等待某个线程运行完成,才进行接下来的操作,称之为线程同步。这种场景通常用于金融交易、购票等等。
Thread对象可以使用join函数,请求主线程 等待 其线程完成。
...
int main() {
std::thread t(myFunction);
t.join(); // 主线程堵塞,等待t中线程完成操作。t中线程 后才能继续主线程操作。
return 0;
}
异步线程 - detach
detach()
: 允许线程独立运行,不需要主线程等待其完成。虽然线程被创建出来默认 就是异步运行的,但你依然需要对其使用它,以示运行完毕后清理该线程。
...
int main() {
std::thread t(myFunction);
t.detach(); // 异步结束清理线程
return 0;
}
线程标识符
每个线程都有一个唯一的标识符,可以使用 std::thread::id
类型和 std::thread::get_id()
函数来获取。
async异步
std::async
是 C++11 标准库中的一个功能,它位于future库,下它允许你异步地执行函数,并可能在另一个线程上运行它。这为并发编程提供了一个简单而强大的工具,特别是当你想并行执行某些任务并获取结果时。
使用 std::async
启动一个异步任务非常简单。你只需传递要执行的函数和其参数:
#include <iostream>
#include <future>
int compute() {
return 42; // Some computation
}
int main() {
std::future<int> result = std::async(compute);
int value = result.get(); // Blocks until the result is ready
std::cout << "Computed value: " << value << std::endl;
}
返回值:std::async
返回一个 std::future
对象,std::future
是 C++11 标准库中的一个模板类,它表示一个异步操作的未来结果。
调用 std::future::get()
会阻塞,直到结果准备好。
启动策略: std::async
可以接受一个可选的启动策略参数,该参数决定任务是立即启动还是延迟启动:
std::launch::async
: 任务在一个新线程上异步启动。std::launch::deferred
: 任务被延迟,直到你调用std::future::get()
或std::future::wait()
时才执行,并在当前线程上执行。
如果你不主动提供启动策略,那么 std::async
可以自由选择策略。但多半会选择std::launch::deferred
策略,所以相当于不会执行异步操作。
std::future<int> result = std::async(std::launch::async, compute);
异常处理: 如果异步任务抛出一个异常,该异常会被存储并在调用 std::future::get()
时重新抛出。所以使用get必要的时候,使用try - catch.
int compute() {
throw std::runtime_error("An error occurred!");
return 42;
}
int main() {
std::future<int> result = std::async(compute);
try {
int value = result.get();
} catch (const std::exception& e) {
std::cerr << "Exception: " << e.what() << std::endl;
}
}
IO流
读取流
字符读取
在 C++ 中,读取字符文件通常使用 <fstream>
库,该库提供了 ifstream
类来支持文件输入操作。以下是使用 ifstream
读取文件的基本步骤:
打开文件
创建一个
ifstream
对象并使用open
方法打开文件。你也可以在构造函数中直接提供文件名来打开文件。std::ifstream file("filename.txt");
其中接受的参数是文件存储位置+文件名,如果没有存储位置则表示读取当前CPP文件下指定文件。
检查文件是否成功打开
ifstream对象的
is_open
函数可以检测文件是否成功打开,如果返回false则表示文件打开错误。if (!file.is_open()) { std::cerr << "Failed to open the file." << std::endl; return 1; // or handle the error appropriately }
读取文件
读取文件类似于cin,分为行读取,单词读取(以空格分割读取)和字符读取。
// getline读取一行字符 std::string line; while (std::getline(file, line)) { std::cout << line << std::endl; } // >>读取单词 std::string word; while (file >> word) { std::cout << word << std::endl; } char ch; // get函数读取字符 while (file.get(ch)) { std::cout << ch; }
关闭文件
和其他语言一样,使用IO流操作后都需要进行关闭操作。
file.close();
当然如果是在块中使用,当你完成文件操作后,文件会在
ifstream
对象的析构函数中自动关闭。
完整示例:
#include <iostream>
#include <fstream>
#include <string>
int main() {
std::ifstream file("filename.txt");
if (!file.is_open()) {
std::cerr << "Failed to open the file." << std::endl;
return 1;
}
std::string line;
while (std::getline(file, line)) {
std::cout << line << std::endl;
}
file.close();
return 0;
}
字节读取
在 C++ 中,如果想按字节(或二进制模式)读取文件,可以使用 <fstream>
库的 ifstream
类,并在打开文件时指定 std::ios::binary
标志。按字节读取文件通常用于处理二进制文件,如图像、音频或其他非文本文件。
以二进制模式打开文件
std::ifstream file("filename.bin", std::ios::binary);
检查文件是否成功打开
检查操作和字符读取一样,使用
is_open()
方法按字节读取文件
读取字节操作主要分为:读取单个字节、读取多个字节:
char byte; while (file.read(&byte, sizeof(byte))) { // Process the byte std::cout << byte; } // 定义一个可以存储1024字节的数组,作为读取缓冲区 const size_t bufferSize = 1024; char buffer[bufferSize]; // 一次读取多个字节到一个缓冲区中 while (file.read(buffer, sizeof(buffer))) { for (size_t i = 0; i < file.gcount(); ++i) { // 处理缓冲区中的每个字节 std::cout << buffer[i]; } }
两者都是使用的
read
方法,接受两个参数。第一个为 读取存放字符or字符串,第二个为 需要读取的大小。此外该函数还具有判断读取是否为空的效果。当你从文件中一次读取多个字节,你通常使用一个缓冲区。缓冲区是一个数组或容器,用于临时存储从文件中读取的数据。使用缓冲区的好处是,与一次读取一个字节相比,它可以更高效地读取大量数据,因为文件操作(特别是磁盘访问)通常比内存操作要慢得多。
注意:
read
方法可能不会填满整个缓冲区,特别是当文件的末尾接近时。你可以使用gcount
方法来确定实际已经读取了多少字节。一旦数据被读入缓冲区,你可以遍历缓冲区并处理每个字节。例如,打印每个字节:for (size_t i = 0; i < file.gcount(); ++i) { std::cout << buffer[i]; }
输出流
文件输出
C++中主要使用std::ofstream
做文本字符输出。std::ofstream
是 C++ 标准库中的一个类,用于写入文件。它是 std::ostream
的一个特化,专门用于文件输出。以下是关于 std::ofstream
的详细介绍:
打开已有文件、创建文件
使用
std::ofstream
,你可以创建一个新文件或写入现有文件。#include <fstream> int main() { std::ofstream file("output.txt"); file << "Hello, File!" << std::endl; file.close(); }
ofstream接受第二个参数,用来指定模式,它拥有多种模式:
std::ios::out
: 输出模式,默认模式。std::ios::app
: 追加模式,写操作从文件末尾开始。std::ios::ate
: 打开文件并移动到文件末尾。std::ios::trunc
: 如果文件已存在,则先截断文件。std::ios::binary
: 二进制模式。
// 以追加模式打开文件
std::ofstream file("output.txt", std::ios::app);
写入操作
使用插入操作符
<<
将数据写入文件,就像使用std::cout
一样。int age = 25; file << "Age: " << age << std::endl;
对于二进制文件的输出,使用write方法。它允许你直接写入原始字节,而不进行任何格式化或转换。
ostream& write(const char* buffer, std::streamsize count);
参数:
buffer
: 一个指向要写入数据的字符数组的指针。count
: 要写入的字节数。
假设你有一个简单的数据结构,并且你想将其写入一个二进制文件:
struct Data { int id; double value; }; int main() { Data data = {123, 456.789}; std::ofstream file("data.bin", std::ios::binary); file.write(reinterpret_cast<const char*>(&data), sizeof(data)); file.close(); return 0; }
注意:使用
reinterpret_cast
将 需要保存的数据结构的指针转换为const char*
,以满足write()
方法的参数要求。将程序的数据外置保存为文件,这种操作叫做序列化操作。
其他有用的方法:
tellp()
: 返回当前的写位置。seekp(pos)
: 将写位置移动到指定的位置。flush()
: 刷新缓冲区,确保所有数据都被写入文件。通常写入文件只有在文件对象被关闭后才会被保存。但当希望确保数据立即被写入磁盘时,可以使用
flush()
。但在不需要立即写入数据的情况下,过度使用它可能会导致性能问题,因为刷新操作可能相对较慢。#include <fstream> int main() { std::ofstream file("output.txt"); file << "Writing some data..."; file.flush(); // 确保文件写入立即完成 // ... more code ... file.close(); return 0; }
当然其实常用的
std::endl
换行操作,不仅仅是一个换行符。当你将std::endl
写入一个输出流时,它也会调用flush()
。但要注意,频繁地使用
std::endl
可能会导致性能下降,因为每次都会触发缓冲区的刷新。如果不需要立即刷新缓冲区,只需要简单的换行操作,在输出文本使用'\n'
通常是更好的选择。
错误处理
文件写出不一定总是顺利,使用
fail()
,bad()
, 和good()
方法可以检查流的状态。例如,如果写操作失败,fail()
会返回true
。if (file.fail()) { // Handle write error }
复制操作
复制操作,简而言之,就是 打开旧文件,读取数据,关闭旧文件,创建新文件,写入数据,关闭新文件。
以下是使用 C++ 复制文件的简单代码:
#include <iostream>
#include <fstream>
bool copyFile(const std::string& sourcePath, const std::string& destPath) {
// 通过二进制模式打开 旧文件
std::ifstream source(sourcePath, std::ios::binary);
// 通过二进制模式创建 新文件
std::ofstream dest(destPath, std::ios::binary);
if (!source.is_open() || !dest.is_open()) {
return false; // 文件打开失败
}
// 使用缓冲区按块复制文件
const size_t bufferSize = 1024; // 例如,1024字节 , 1KB
char buffer[bufferSize];
while (source.read(buffer, bufferSize)) {
dest.write(buffer, source.gcount());
}
// 处理最后一个不完整的块(如果有的话)
dest.write(buffer, source.gcount());
source.close();
dest.close();
return true;
}
int main() {
if (copyFile("source.txt", "destination.txt")) {
std::cout << "File copied successfully!" << std::endl;
} else {
std::cerr << "Error copying file." << std::endl;
}
return 0;
}
说明:
- 二进制模式: 在打开文件时,我们使用了
std::ios::binary
标志。这确保文件以二进制模式进行读写,这对于非文本文件(如图像或可执行文件)尤为重要。即使是文本文件,使用二进制模式也是一个好主意,因为它可以确保文件的内容不会被修改(例如,换行符的转换)。 - 按块复制: 使用缓冲区按块读取和写入文件比逐字节复制更高效。这是因为文件操作(特别是磁盘访问)通常比内存操作要慢得多。
- 错误处理: 在实际应用中,你可能需要更详细的错误处理,例如检查文件是否存在、是否有足够的磁盘空间等。上述示例提供了基本的错误处理,但在生产环境中可能需要更多的细节。
序列化操作
序列化是一个过程,其中数据结构或对象的状态被转换为一个可以存储或传输的格式。序列化后的数据可以随后被重新构建(或反序列化)为原始数据结构或对象。序列化常用于以下场景:
- 数据持久性:将对象保存到文件或数据库中。
- 远程过程调用:例如,在网络上发送对象。
- 分布式计算:将数据发送到另一个进程或机器进行处理。
- 深拷贝:创建对象的完整副本。
在 C++ 中,没有内置的序列化机制,但有多种方法可以实现序列化:
- 手动序列化: 你可以为每个类或数据结构编写自己的序列化和反序列化函数。这通常涉及利用IO流将每个成员变量转换为字节流,并在反序列化时执行相反的操作。
struct Data {
int id;
std::string name;
// 序列化操作,将数据输出为外置文件.
void serialize(std::ofstream& os) const {
os.write(reinterpret_cast<const char*>(&id), sizeof(id));
size_t length = name.size();
os.write(reinterpret_cast<const char*>(&length), sizeof(length));
os.write(name.c_str(), length);
}
// 反序列化操作,读取外置文件数据为数据.
void deserialize(std::ifstream& is) {
is.read(reinterpret_cast<char*>(&id), sizeof(id));
size_t length;
is.read(reinterpret_cast<char*>(&length), sizeof(length));
char* buffer = new char[length];
is.read(buffer, length);
name.assign(buffer, length);
delete[] buffer;
}
};
- 使用库: 相比于手动序列化操作,使用 第三方C++ 库提供序列化功能,这些库通常更灵活、更安全,并处理许多边缘情况。
- Boost.Serialization: 这是一个非常强大的库,支持多种数据格式(如二进制、XML 和文本)和复杂的数据结构。
- Cereal: 这是一个现代、轻量级的 C++11 序列化库。
- protobuf (Google Protocol Buffers): 这是一个高效的序列化库,特别适用于网络通信和数据存储。
- 注意事项:
- 版本控制: 如果数据结构在不同的软件版本之间发生变化,你需要确保旧版本的数据可以在新版本的软件中被正确反序列化。
- 安全性: 当反序列化来自不受信任的源的数据时,需要特别小心,因为恶意的或损坏的数据可能导致未定义的行为或安全漏洞。
- 性能: 序列化和反序列化可能是计算密集型的,特别是对于大型或复杂的数据结构。
左值、右值
C++中引入了一个 左右值 概念。它们描述了对象在内存中的位置和身份。
理解这个概念对于深入了解 C++ 的内存管理和新的 C++11/14/17 中引入的移动语义特别重要。
直接用代码解释:
int A = 12;
12 = 16; //Error,12本身是编译器中的固定值不能被赋值
简单来说 =号 (赋值符)左边的对象即 左值,右边的对象即右值。上述A对象即 左值,12为右值。
左值通常为可赋值的元素,而右值不能被赋值。当然这些只是片面解释。
左值 (Lvalue)
- 定义:左值是一个可以定位到存储位置的表达式,是实际存储位置的元素。换句话说,左值有一个可以访问的内存地址。
- 名称的来源:左值的名称来源于它可以出现在赋值操作的左边或右边(也就是说出现左值 不仅只能在赋值符左边)。
- 示例:变量通常是左值,因为它们代表一个具体的内存位置。
int x = 10; // x 是左值
x = 20; // x 可以出现在赋值操作的左边
右值 (Rvalue)
- 定义:右值是一个不代表存储位置的表达式,因此不能为其分配值。它是一个临时的、无名的值,或者说是一个即将被销毁的值。
- 名称的来源:右值的名称来源于它只能出现在赋值操作的右边。
- 示例:字面量、临时对象或返回值都是右值。
int c = 13; // 13是右值
int b = c; // c是实际明确的元素,c是左值
int y = c + b; // 赋值的整体是 (c + b),它将作为一个临时值, 即c+b 是右值
右值引用
在 C++11 及以后的版本中,为了优化资源管理和提高性能,引入了右值引用和移动语义的概念。
常规的引用都是其左值引用
,引用的是存储 在内存中的对象。
int a = 2;
int& b = a; // 这是常规的"引用",也就是"左值引用"
而右值引用,使用类型&&
表示。顾名思义就是 对临时的、未定义的值的引用。
int&& rvalueRef = 10 + 20; // 10 + 20 是一个右值
下面是解释:
void printName(std::string& name)
{
...
}
上述函数中参数明确了定义了一个string左值引用,它支持接受一个string对象,注意这里没有加上const修饰符。
std:string a = "Zssaer";
printName(a);
上面printName接收了一个定义了的string对象a。但如果当我们直接让其接受未定义的一个字符串呢?
printName(std::string("Ryan Kity")); // 编译报错。显示printName不接受临时元素。
为了避开隐式转换的关系,特别使用了string构造函数,但上述操作依然编译报错,表示printName函数无法接受未定义的临时元素。
C++中为了让其函数接受临时元素的右值,有两者方法:
在接受左值引用参数前加上const修饰符,这是最常见的操作。
表示该值不能被修改,这种设计决策的背后是一个安全性的考虑:临时值是短暂的,它们在表达式结束后就会被销毁。如果允许非
const
引用绑定到临时值,并在函数内部修改它,那么这可能会导致意外的行为,因为你实际上正在修改一个即将被销毁的值。但是这种方式其实会额外触发接受函数的
拷贝构造函数
,额外增加程序内存开销,这个问题将会在后面移动语义中出现。void func(const int& x) { // ... } int main() { int a = 12; func(a); func(42); // 42 是一个临时值 return 0; }
使用右值引用。
void func(int&& x) { // ... } int main() { func(42); // 42 是一个临时值 int a = 12; func(a); // 编译错误,函数不在支持定义了的对象. return 0; }
上述函数支持了临时值,但对于定义了的左值便不再支持了。
移动语义
移动语义是C++11引入的重要特性之一。它是左右值知识点的重要点,也是难点。
它允许资源从一个对象“移动”到另一个对象,而不是传统的复制。理解它能够有效的优化函数的定义、赋值操作。
下面是一段典型的A包含B 代码:
class EntityA
{
private:
std::string name;
public:
EntityA(const std::string& string) //构造函数
: name(string)
{
printf("Created!\n");
}
EntityA(const EntityA& other) // 拷贝构造函数
: name(other.name)
{
printf("Copied!\n");
}
void sayMyName()
{
printf(name.c_str());
printf("\n");
}
};
class EntityB
{
private:
EntityA m_a;
public:
EntityB(const EntityA& a)
: m_a(a)
{
}
void printName()
{
m_a.sayMyName();
}
};
int main()
{
EntityB entity_b(EntityA("Zssaer"));
entity_b.printName();
std::cin.get();
}
上述中 EntityB 类 包含了一个EntityA,EntityA中包含了一个name字符串成员。
我们使用EntityB entity_b(EntityA("Zssaer"));
创建 EntityB对象。最后输出:
Created!
Copied!
Zssaer
这里不仅调用了EntityA本身的构造函数,还调用了拷贝构造函数。相当于整个流程是这样的:
EntityA entity_a("Zssaer"); //调用EntityA构造函数
EntityB entity_b();
entity_b.m_a = entity_a; //调用EntityA拷贝构造函数
整个流程中,我们临时创建entity_a对象,然后又拷贝赋值到entity_b,相当于白白浪费掉了entity_a对象。
对于合理的节约空间,其实entity_b中m_a 应该直接使用临时创建的entity_a对象,而不是再去复制创建一个新的。
这便是移动语义的存在含义:移动直接使用右值,而不是拷贝值。
要知道移动代替拷贝,我们需要在EntityA类中创建 移动构造函数,它和拷贝构造函数很相似,它的作用是移动临时的右值 构建一个对象。
PS : 移动构造函数就是本身的右值引用函数.
EntityA(EntityA&& other) noexcept
{
printf("Move!\n");
}
这样EntityA类就实现了右值的移动创建。
然后需要在EntityB中实现右值的移动创建,因为它们是包含的:
EntityB(EntityA&& a)
: m_a((EntityA&&)a) //: m_a(std::move(a))
{
}
上方初始化中,一定要将其a强行转换(也可以使用std::move 将其转换为右值引用)为 右值引用类型,不然依旧会以左值的方式调用拷贝构造函数。因为右值引用在函数体内定义后,就默认变为了左值引用了,在初始化中依然需要再次定义为右值引用,这样才能调用EntityA的移动构造函数。
除此之外,还可以使用std::forward函数模板:
std::forward
是C++标准库中的一个函数模板,通常用于在泛型编程中完美转发(perfect forwarding)参数。完美转发是一种技术,用于将参数以原样传递给另一个函数,包括参数的值类别(lvalue 或 rvalue)。它在C++11引入的右值引用(rvalue reference)和移动语义的背景下变得特别重要。在C++中,有两种主要的值类别:左值(lvalue)和右值(rvalue)。
- 左值(lvalue)通常是可以取地址的表达式,如变量名或具有名称的表达式。
- 右值(rvalue)通常是临时值或不具有名称的表达式。
std::forward
的主要目的是确保将参数以正确的值类别传递给其他函数,以避免不必要的拷贝或移动操作。它通常在函数模板中与引用折叠和转发引用一起使用,以保持参数的原始值类别。
EntityB(EntityA&& a)
: m_a(std::forward<EntityA>(a)) //: m_a(std::move(a))
{
}
这样便将其临时创建的EntityA对象直接以Move的方式,而不是Copy方式,定义到了EntityB中的m_a中了。
总结:简而言之,移动语义就是将其临时的右值直接应用到 左值中,而不是再额外Copy。 主要的操作方式是使用 移动构造函数。
移动语义的主要优势是性能提升。例如,当你返回一个大型 std::vector
或 std::string
时,使用移动语义可以避免不必要的数据复制。此外,它还使得某些资源管理模式,如独占所有权模式,变得更加简单和高效。
三法则、五法则
如果类定义了 拷贝构造函数(copy ctor)、拷贝赋值运算符(copy operator=)或析构函数(dtor),通常也需要考虑合理定义其他两个,这被称为 **”Rule of Three/三法则”**。
在 C++11 及以后,这个规则扩展到五个,包括移动构造函数(move ctor)和移动赋值运算符(move operator=),称为**”Rule of Five/五法则”**。
如果在没有特殊需求情况下,往往直接delete掉其他like “copy ctor”、“operator=”操作。这时良好的且优秀的C++代码的体现。
优雅地处理函数返回错误
C++中使用异常处理非常繁琐,在项目中通常以返回错误码来提示错误。
下面是优雅地返回错误解决方法:
#include <utility>
template <class Policy, class I, class Fn, class...Args> // requires...
constexpr I exec_on(Policy const &p, I code, Fn &&f, Args&&...args) // noexcept(...)
{
if (p(code))
return std::forward<Fn>(f)(std::forward<Args>(args)...);
else
return code;
}
int f() noexcept { return 0; } // to be impl
int g() noexcept { return 0; } // to be impl
int h() noexcept { return 0; } // to be impl
void error_report(int) noexcept {} // 错误码处理函数
int main()
{
constexpr auto cond_nonminus = [](auto const &v) { return v >= 0; };
int ret1 = exec_on(cond_nonminus, 0, f);
int ret2 = exec_on(cond_nonminus, ret1, g);
int ret3 = exec_on(cond_nonminus, ret2, h);
if (ret3 < 0)
error_report(ret3);
}