Join 类
对两个 DynamicFrames 执行等式联接。
方法
__call__(frame1, frame2, keys1, keys2, transformation_ctx = "")
对两个 DynamicFrames 执行等式联接。
frame1– 要联接的第一个DynamicFrame(必需)。frame2– 要联接的第二个DynamicFrame(必需)。keys1– 第一个帧要联接的键 (必需)。keys2– 第二个帧要联接的键 (必需)。transformation_ctx– 用于标识状态信息的唯一字符串 (可选)。
返回通过联接两个 DynamicFrames 所获得的新的 DynamicFrame。
apply(cls, *args, **kwargs)
继承自 GlueTransform Apply
name(cls)
继承自 GlueTransform 名称
describeArgs(cls)
继承自 GlueTransform describeArgs
describeReturn(cls)
继承自 GlueTransform describeReturn
describeTransform(cls)
继承自 GlueTransform describeTransform
describeErrors(cls)
继承自 GlueTransform describeErrors
describe(cls)
继承自 GlueTransform Describe
联合示例
Join 函数可管理重复的列。每个数据集都有一个名为 zip 的列。Amazon Glue 会向其中一个重复的列名添加句点 (.),以避免出现错误。
dyf_join = Join.apply(dyf_json, dyf_selectFields, 'zip', 'zip') dyf_join.toDF().show() +--------------------+-----+-----+ | customers| .zip| zip| +--------------------+-----+-----+ |[[108 Park Street...|75091|75091| |[[66 P Street, NY...|75023|75023| |[[708 Fed Ln, CA,...|90093|90093| +--------------------+-----+-----+