处理两种类型的错误很重要。这些不是脚本中的错误,而是片段结构中的错误导致Beautiful Soup的API抛出错误。
一个AttributeError当点符号没有找到兄弟标签当前HTML标记将被抛出。例如,如果特定代码段没有锚标记,那么代价键将抛出错误,因为它会横向并因此需要锚标记。
另一个错误是KeyError。如果缺少必需的HTML标记属性,则会抛出它。例如,如果代码段中没有data-pid属性,则pid键将引发错误。
如果在解析结果时发生这些错误中的任何一个,则将跳过该结果以确保未将错误的片段插入到数据库中: