• delphi.指针.应用


    注:初稿...有点乱,可能增删改...

          因为指针应用,感觉不好写,请大家指出错误,谢谢。

    注意: 本文着重点讲的是指针的各类型的应用或使用,而不是说这种方法不应该+不安全+危险+不提倡使用。

    其它:本文说的是x86环境,x64会有变化,且,只是讲述一些方法,细节部分,如果涉及到不同平台问题,勿太深究。:)

    指针:按正规解释是:“指向另一内存块地址的变量”,它是一个变量值,只有4字节(x86=>sizeof(Pointer)=4, x64=8,以下都以x86为准)。

    所以,它与内存其实息息相关,所以讲述前,我们要懂一个道理,指针,其实就是一个内存块地址的“代号”。

    指针应用: 常用操作就是:New/GetMem后进行操作,然后Dispose/FreeMem,估计大伙都用的多了,这个不用多说了。

    所想写的,是自己看到过的,写过的,遇到的及其延伸,总结一下,希望对大家有帮助。

    指针方法一:强制转换 

          <警告:这种操作也最危险,不安全,容易造成越界形为,且难以发现问题>。

          先将警告放上面,这个表示:要慎重对待些操作,原因:

          a: 容易越界,且无错误提示。

           越界即在超出规定安全范围内,引申在此,则是说操作:安全内存块范围外的内存块

           有点绕口,不过很容易理解,安全内存块4字节,如果操作了4字节外的内存外就是越界。

           越界的危害是严重级别,且难找的,如果细说,能说一堆,这里略过,因为着重点不在于此。 

         b:数据不正确

            强制转换,对于非恰当的数据时,它直接更改是数据值,在安全操作(不超出内存边界情况下),无任何提示,事后难以查觉。

            数据的正确性给破坏,且无错误,对一个程序的危害是不言而喻了。

         好了,危害说完,我得说:强制转换操作,确实很好用,且高效。

         下面开始列举我经常使用的操作:

         1:Pointer 与 TObject及子类实例的转换 

          Pointer与对象实例的转换可以互换的,且没有编绎提示。 

          因为对象实例其实说白了就是一个指针,只不过编绎器进行检查,来个编绎错误,不让你转换。 

          其它:Pointer对其它数据类型的指针,也不需要:v := PDataType(p)这样写,直接: v := p; 反过来亦然。

          注意:仅是Pointer类型, 所以,Pointer类型是强大的。

               UI相关:在UI操作,很多组件是带有用户自定义的属性,用于用户扩展属性的关联,如:

               TStrings.Objects (TCombobox.Items/TListBox.Items/TMemo.Lines...)

               TListItem.Data/TListNode.Data

               TComponent.Tag: Integer --(只针对x86,不知道x64改为NativeInt没)

              这类相关的扩展属性,要么是Pointer,要么是TObject,如果自己需要与之上下文相关的扩展数据,最方便使用了。

     1 type
     2   PMyData = ^TMyData;
     3   TMyData = record
     4     v1: Integer;
     5     v2: string;
     6   end;
     7  
     8 // 对扩展属性设置
     9 var
    10   entry: PMyData;
    11 begin
    12   new(entry);
    13   entry.v1 := xx;
    14   entry.v2 := yy;
    15   Combobox1.Lines.AddObject('test', Pointer(entry));
    16   Listbox1.Items.AddObject('test', Pointer(entry));
    17   with Listview1.Items.Add do
    18   begin
    19     caption := 'test';
    20     subItems.Add('sub-item');
    21     data := entry;
    22   end; 
    23 end;
    24  
    25 // 从扩展属性中读取
    26 var
    27   index: Integer;
    28   entry: PMyData;
    29 begin
    30   index := Combobox1.ItemIndex;
    31   if index <> -1 then
    32   begin
    33     entry := Pointer(Combobox1.Lines.Objects[index]);
    34     ShowMessage(entry.v2);
    35   end;
    36  
    37   // listbox1如上使用
    38   // ListItem取的是data属性
    39 end;
    View Code

            其它转换:

             sizeof(Pointer) = sizeof(Cardinal) = sizeof(Integer) = ... = 4 (x86)

             所以,更多的时候,这类转换也是常用的,如:指针前进X字节:Pointer(Cardinal(p) + x); (x86)

             还有Pointer与Cardinal/Integer相互转换,p = Pointer(v); v := Cardinal(p); ... 

             Pointer类型转换很方便,所以,写组件时,为需要的类增加一个CustomData: Pointer,会是一种常态的写法:)

       2: buffer/Pointer与各类数据转换,及相关操作

            更多的时候,我们需要与各种数据类型打交道,进行数据操作,协议封包(数据打包)

            示例:发送一个数据包:格式:前4字节为长度,后4命令字,再根据命令字,进行跟随X字节。

            通常的做法是:TMemoryStream,然后不断按协议进行Stream.Read/Write?经常能见到此似代码。

            还有种做法:用string(ansi版本下)来代替TMemoryStream,因为Pos+Delete是相当方便,不过对于里面的代码,只能表示呵呵。

            如果现在再写,会是写成如下:

     1 // 首先, 先定义好数据格式
     2 const
     3   CMD_01 = $0001;
     4   CMD_02 = $0002;
     5 
     6 type
     7   PProtocolData = ^TProtocolData;
     8   TProtocolData = packed record
     9     len: int32;
    10     cmd: int32;
    11     case Integer of
    12       CMD_01: ( cmd_01: TProtocolCmd01; );
    13       CMD_02: ( cmd_02: TProtocolCmd02; );
    14   end;
    15 
    16 // 打包/封包,直接利用格式,进行转换+写入
    17 var
    18   data: PProtocolData;
    19   buffer: array [0..MAX_SIZE - 1] of Byte;
    20 begin
    21   data := @buffer[0];
    22   data.len := xx;
    23   data.cmd := CMD_01;
    24   data.cmd_01 := cmd_01_data;
    25   send(data, data.len);
    26 end;
    27 
    28 // 解包,直接用数据格式指针转换buffer
    29 procedure do_some(buffer: Pointer; size: int32);
    30 var
    31   data: PProtocolData;
    32 begin
    33   data := buffer;
    34   if size < data.len then
    35     errormsg_and_exit('data packet is invalid.');
    36 
    37   case data.cmd of
    38     CMD_01: do_cmd_01(data.cmd_01);
    39     CMD_02: do_cmd_02(data.cmd_02);
    40   end;
    41 end;
    View Code

            额,得注意:只适合定长的类型,如果有不定长的格式,buffer无法确认最大长度的,就得GetMem出场了(或SendBuffer+SendBufLen)

           这写法的好处:

           其一:数据类型更改好动手,比如协议版本升级,在cmd后面要加个seq: int32字段,按Stream的作法,你得先找到cmd写入的地方,

                   后面加句:Stream.Write(seq...),位置顺序不能变,如果位置不对,你就得抓瞎,抓协议数据包来找问题了。

                   如按上面,只要在定义中,cmd字段后加:seq: int32,然后,找个地方赋值就好了。

                   且重要的是:可以通过record定义,来知道协议的那几个字节都是做什么的,啥意思,这给后来开发人员减少出错的机会。

           其二:解析(解包)简单

                   收到协议包的buffer后,判断一下包长度是否正常,正常就直接转换为对应指针类型,然后就p.xx就读取操作了。

                   如果按stream的方法,你得不停的Stream.Read(xxx)...

          好了,你还用Stream的方法做协议打包解包吗?:D

               

          其它定长转换,还有种典型就是:如果是固定长度格式的字符串解析,可以使用先定义,再转换,如时间:

     1 // s = '2014-10-01 08:09:10'
     2 function ToDateTime(const s: string): TDatetime;
     3 type
     4   PMyDateString = ^TMyDateString;
     5   TMyDateString = packed record
     6     YY: array [0..3] of Char;
     7     S1: Char;
     8     MM: array [0..1] of Char;
     9     S2: Char;
    10     DD: array [0..1] of Char;
    11     S3: Char;
    12     HH: array [0..1] of Char;
    13     S4: Char;
    14     NN: array [0..1] of Char;
    15     S5: char;
    16     SS: array [0..1] of Char;
    17   end;
    18 var
    19   p: PMyDateString;
    20   yy, mm, dd, hh, nn, ss: Word;
    21 begin
    22   if Length(s) < sizeof(TMyDateString) then
    23     error_and_exit('invalid date string');
    24 
    25   p := Pointer(s);
    26   yy := ToWord(p.YY, sizeof(p.YY));
    27   mm := ToWord(p.MM, sizeof(p.MM));
    28   ...
    29   result := EncodeDate(yy, mm, dd) + EncodeTime(hh, nn, ss, 0);
    30 end;
    View Code

           注:此法,只合适那种有固定格式的情况。

           这里只是举例,是种思路,不是建议。一时半会的想不到更好的示例,就想到这个(时间一堆的函数可以转换,不用这样写)


       3:Pointer与var的转换

           这个,不知怎么说了,所以写成var了,这个不好解释,请查示例:

     1 Delphi定义
     2 function ReadFile(hFile: THandle; var Buffer; nNumberOfBytesToRead: DWORD;
     3   var lpNumberOfBytesRead: DWORD; lpOverlapped: POverlapped): BOOL; stdcall;
     4 C++定义
     5 BOOL ReadFile(
     6     HANDLE hFile,    // handle of file to read 
     7     LPVOID lpBuffer,    // address of buffer that receives data  
     8     DWORD nNumberOfBytesToRead,    // number of bytes to read 
     9     LPDWORD lpNumberOfBytesRead,    // address of number of bytes read 
    10     LPOVERLAPPED lpOverlapped     // address of structure for data 
    11    );
    12 
    13 var Buffer   ==>  LPVOID lpBuffer
    14 var lpNumberOfBytesRead: DWORD;  ==> LPDWORD lpNumberOfBytesRead
    View Code

         上面只是一个函数声明,其中第二参数与第四参数很有意思。

          var buf; const buf; 在System.Move/Stream.Read/Write中很常见这类参数,具体名称,这个还真没注意,无类型参数(暂且这样叫)

         如果对应于C/C++来说,它应该是LPVOID,这是D自有的数据类型,它是需要传递数据内存块起始位置。如string[1], Integer/及sizeof可计算长度的,直接传递。

         扯远了,继续看第四参数,才是我要表达的重点,var X: DWORD  等价于 X: PWORD; 这是D中最自由的部分。

         然后延伸:我定义一函数/方法或回调指针,如:

     1 type
     2   TMyEvent = procedure(AParam: Integer; Custom: Pointer);
     3 
     4 procedure DoJob(event: TMyEvent; custom: Pointer);
     5 begin
     6   if assigned(@event) then
     7     event(10, custom);
     8 end;
     9 
    10 
    11 // 上面是最简单的,也是经典回调或事件写法吧,经常写事件或接口API,都明白怎么回事。
    12 
    13 // 然后调用,对于custom: Pointer就自由了,请看:
    14 type
    15   PMyData = ^TMyData;
    16   TMyData = record
    17     x, y: Integer;
    18   end;
    19 
    20 procedure OnEvent1(param: Integer; var data: TMyData);
    21 begin
    22   data.x := param * 2;
    23   data.y := param * 3;
    24 end;
    25 
    26 procedure TForm1.Button1Click(Sender: TObject);
    27 var
    28   data: TMyData;
    29 begin
    30   data.x := 0;
    31   data.y := 0;
    32   DoJob(@OnEvent1, @data);
    33   ShowMessageFmt('x: %d, y: %d', [data.x, data.y]));
    34 end;
    View Code

         看明白了没?OnEvent1对应的回调第二参数写成var data: TMyData,且编绎+结果正确。

         Pointer只是一个指针,var也是传地址进行操作,本质是一样的,所以,我们写这个custom: Pointer是可以多变的。

         以上,只是一个例子,请再回头看Pointer与对象,其它数据类型转换,你就可以自己继续延伸,写自己的自由写法了。


    指针方法二: 指针+-运算

         指针的+-运算,即:p := p + 1; p := p - 1; 非inc(...)及 p := Pointer(Cardinal(p) + 1);此类。

         D2007(包括)以下版本,这种操作仅限于PChar(PAnsiChar)可以这样进行操作,D2010开始PByte也可以了:)

         PAnsiChar +- len           => PAnsiChar;

         PAnsiChar +- PAnsichar => len

         就这是原因,因为两地址相加减,可得到长度,在字符串解析过程中,保留一个指针A,另一指针B进行规则匹配,

         然后B-A,就得到一个规则内的长度,这个写字符或内存状态解析,是一个常用手法。

         PAnsiChar支持下标(p[x] := xx; (p + x)^ := xx),其它, PByte要到高版本才支持。

         注:个人更喜欢用PAnsiChar进行操作,而不是PByte, Cardinal, NativeUInt, IntPtr之类。

               原因很简单:

                   a: PAnsiChar从低版本(ansi)兼容到高版本的XE(unicode),且一直支持+-操作    

                   b: PByte的+-到D2010才支持

                   c: Cardinal进行+-,到了XE2 x64后,就不对了,因为x64的指针值是8字节

                   d: NativeUInt/IntPtr低版本不支持。

             

         。。。其它用法,想到再加。 


    指针应用方法三: 偏移

         指针偏移在D里面,估计大家都很少用它操作,但估计个个都在用。

         因为不管用哪种语言,这种操作手法是最常用的,因为这手法,内存管理用的最多了:D

         都是用了这些简单的手法进行一系列的操作后,才返回给使用者的。

         看下面一段很有意思的代码:

     1 type
     2   PStrRec = ^TStrRec;
     3   TStrRec = packed record
     4   {$if defined(CPUX64)}
     5     padding: LongInt;
     6   {$ifend}
     7   {$if CompilerVersion >= 20.0}
     8     code: Word;
     9     elem: Word;
    10   {$ifend}
    11     ref: Integer;
    12     len: Integer;
    13     data: array [0..0] of Char;
    14   end;
    15 
    16 procedure TForm1.FormCreate(Sender: TObject);
    17 begin
    18   ReportMemoryLeaksOnShutdown := True;
    19 end;
    20 
    21 procedure TForm1.Button1Click(Sender: TObject);
    22 var
    23   p: PStrRec;
    24   s: string;
    25 begin
    26   p := AllocMem(sizeof(TStrRec) + sizeof(Char) * 10);
    27   p.ref := 1;
    28   p.len := 10;
    29   StrPLcopy(p.data, 'abc', 3);
    30 
    31   Pointer(s) := @p.data[0];
    32   ShowMessage(s);
    33 end;
    View Code

         输入完这代码后,运行后点击一下button,显示了abc的BOX,然后退出。是不是发现没有泄露啊:)

         上面代码,其实就是模拟了string构成,p就是string的基本构成,然后s接管了p的生存期,然后出了Button1Click作用域后,s就会自动给free了。

         额,扯远了,string构成不是重点,重点是偏移,平常所用的string,其实就是一个偏移的手法,只不过D隐藏了。

         上面例子中,Pointer(s) := @p.data[0]就是一个偏移的做法。

         指针偏移概念(个人理解):

             a: 后偏移:在真实地址后,根据自己的规则,进行移动固定字节后(后偏移),得到的新地址返回给调用者。

                  这种方式是:GetMem取得X+Y个字节,X=自己分配规则固定长度,Y=req.size,返回时,地址向后移动X (addr := P + X)

                                    释放的时候,将地址向后移动向前移动X字节,再行FreeMem,string就是这种情况。

             b: 不偏移:申请到的地址,不移动地址,但它申请的长度比请求的大,其它长度,用于其它处理。

                 还是: P := GetMem(X+Y),其中,X长度是A处理所需,Y长度是B处理所需

     1 type
     2   PMyData = ^TMyData;
     3   TMyData = record
     4     v1, v2: Integer;
     5   end;
     6 
     7   PMyDataEx = ^TMyDataEx;
     8   TMyDataEx = record
     9     data: TMyData;
    10     dataEx1: Integer;
    11     dataEx2: Integer;
    12   end;
    13 
    14 procedure DoData(p: PMyData);
    15 begin
    16   p.v1 := 1;
    17   p.v2 := 2;
    18 end;
    19 
    20 procedure DoDataEx(p: PMyData);
    21 var
    22   e: PMyDataEx;
    23 begin
    24   e := Pointer(p);
    25   e.dataEx1 := 10;
    26   e.dataEx2 := 20;
    27 end;
    View Code

                 额,好像跟偏移没啥关系,不过,个人觉得还是归纳到这里。

             偏移,用话来说就是:你操作你的,我操作我的,各不相干。

         

         使用指针偏移目地:

             上面已经举例偏移,可能有人会觉得麻烦,有啥子用。我也觉得这种方式的代码确实有些限制,也不好写。

             但有几点好处:

               a: 减少内存分配次数:少一次分配就加一分效率,在某些场合是能省则省。

               b:定位查找快,如果不用这法子,查找这地址与之相匹配的上下文(context),你得循环?hash?

                    这玩意用个指针+-的法子,就可以找到对应的数据,为何不用?

             坏处也是有的:

                a: 增加代码复杂度

                b: 出错几率相对大

             哈,有好有坏,:)

    先写到这里了。以后想到啥再写,或整理,或细化一下,感觉写得不是很工整。。。 

     
    额,水平有限,如有雷同,就是盗版!

    2014.10.18 by qsl

  • 相关阅读:
    使用sudo crontab修改Linux系统时间
    Redis缓存雪崩和穿透的解决方法
    设计模式之委托模式
    设计模式之模板模式
    并发编程面试题
    AQS之共享锁实现原理
    AQS之独占锁实现原理
    CentOS 7.1 Bridge启用STP报错"Master connection not found or invalid"
    nginx反向代理docker registry报”blob upload unknown"解决办法
    [转]Linux df 命令不更新磁盘数据空间使用情况的解决办法
  • 原文地址:https://www.cnblogs.com/qiusl/p/4026459.html
Copyright © 2020-2023  润新知