为基于规则的解析器配置抽取程序组件

先决条件:

在基于规则的日志解析器中,抽取程序的作用是采用传感器提供的一组输入行并将它们分为消息边界。要配置抽取程序,首先需要确定抽取程序类(要使用这些抽取程序类)。然后,可以根据选择的抽取程序类配置抽取程序规则

配置抽取程序类

所用的缺省抽取程序类是正则表达式抽取程序。可以通过修改“适配器配置”文件“上下文”部分中的“抽取程序”组件来更改抽取程序类。

  1. 在适配器配置编辑器中,展开节点上下文 > 上下文基本上下文实现。“基本上下文实现”详细信息会显示在右窗格中。
  2. 选择组件正则表达式抽取程序。抽取程序属性会显示在右窗格中。

    抽取程序名称、描述和可执行的类列示在属性窗格中

  3. 将可执行的类更新为想要使用的类。有关详细信息,请参阅配置文件结构参考主题以了解通用日志适配器提供的抽取程序类。
  4. 保存适配器配置文件更改。

配置抽取程序规则

一旦确定了要使用哪个抽取程序类,就可以在上下文实例中为该抽取程序编写相应的规则。

  1. 在“适配器配置”编辑器的左窗格中,选择配置 > 上下文实例 > 抽取程序。右窗格会显示抽取程序信息。

    传感器配置

  2. 如果日志文件包含在文件中跨多行的记录,则选择包含换行符复选框。如果日志文件中的每行都是一个独立的记录或者如果日志文件中没有换行符,则不要选择此复选框。
  3. 如果要将换行符替换为另一个符号,则选择替换换行符并在换行符号字段中输入该符号。
    注意:使用此选项的副作用是,除非解析器替换规则显式地添加换行符,否则从日志文件中解析的值将不包含换行符。
  4. 开始模式字段中编写脚本段以标识开始模式。缺省正则表达式是插入标记 ^ 符号,它是与字符串或行的开头匹配的空标记。
  5. 要将开始模式包括在结果中,选择包括开始模式复选框。
  6. 结束模式字段中编写脚本段以标识结束模式。缺省正则表达式是美元 $ 符号,它是与字符串或行的末尾匹配的空标记。
  7. 要将结束模式包括在结果中,选择包括结束模式复选框。
    提示:为了帮助您标识开始模式和结束模式,单击重新运行图标 重新运行适配器图标的图形,然后单击显示日志 显示日志图标 图标。传感器已读取的日志内容会显示在“传感器结果”视图中。
  8. 保存适配器配置文件以应用更改。
  9. 要测试规则,单击重新运行适配器 “重新运行适配器”图标的图形 图标以运行适配器。结果将显示在“抽取程序结果”视图中。
    提示:您可以指定要从哪个记录号开始查看。使用“重新运行适配器”图标上的下拉菜单并选择从记录开始。这将打开一个对话框,该对话框允许您指定要从哪个记录号开始。
  10. 单击显示下一个事件 “显示下一个事件”图标的图形 图标以查看已按照所编写的抽取程序规则处理的每个日志记录。

    抽取程序规则的图像,“抽取程序结果”视图中的输出结果省略了开始模式但使用了缺省结束模式。


    提示:要更改可供查看的结果条目数,请单击通用日志适配器首选项图标 gla 首选项图标 以打开首选项页面。在首选项页面打开后,可以更新缓冲区大小。

有关抽取程序属性的详细描述,请参阅适配器配置文件结构参考文档。

创建基于规则的适配器的下一步是配置解析器组件。

相关概念
Hyades 通用日志适配器概述

相关任务
配置解析器组件

相关参考
适配器配置文件结构
适配器配置编辑器
正则表达式语法
适配器配置编辑器的局限性