SETL-Framework
diff --git a/‎src/main/scala/io/github/setl/transformation/FactoryOutput.scala‎
Lines changed: 9 additions & 3 deletions b/‎src/main/scala/io/github/setl/transformation/FactoryOutput.scala‎
Lines changed: 9 additions & 3 deletions
diff --git a/‎src/test/scala/io/github/setl/workflow/PipelineSuite.scala‎
Lines changed: 31 additions & 4 deletions b/‎src/test/scala/io/github/setl/workflow/PipelineSuite.scala‎
Lines changed: 31 additions & 4 deletions
@@ -32,9 +32,15 @@ private[setl] case class FactoryOutput(override val runtimeType: runtime.univers
  }
 
  if (isDataset) {
- val datasetTypeArgFields = super.getTypeArgList(this.runtimeType.typeArgs.head)
- datasetTypeArgFields.map {
- i => s">${i.name}: ${ReflectUtils.getPrettyName(i.typeSignature)}"
+ if (this.runtimeType.typeArgs.isEmpty) {
+ // DataFrame
+ List.empty
+ } else {
+ // Dataset
+ val datasetTypeArgFields = super.getTypeArgList(this.runtimeType.typeArgs.head)
+ datasetTypeArgFields.map {
+ i => s">${i.name}: ${ReflectUtils.getPrettyName(i.typeSignature)}"
+ }
  }
 
  } else if (isCaseClass) {
 
@@ -8,7 +8,7 @@ import io.github.setl.storage.SparkRepositoryBuilder
 import io.github.setl.storage.connector.FileConnector
 import io.github.setl.transformation.{Deliverable, Factory}
 import io.github.setl.workflow.DeliverableDispatcherSuite.FactoryWithMultipleAutoLoad
-import org.apache.spark.sql.{Dataset, SparkSession, functions}
+import org.apache.spark.sql.{DataFrame, Dataset, SparkSession, functions}
 import org.scalatest.funsuite.AnyFunSuite
 import org.scalatest.matchers.should.Matchers
 
@@ -595,6 +595,20 @@ class PipelineSuite extends AnyFunSuite with Matchers {
  fac.floatArray should contain theSameElementsAs fltAry
  }
 
+ test("SETL-197: Mermaid diagram should be shown even when the factory output is a DataFrame") {
+ val spark = new SparkSessionBuilder("test").setEnv("local").setSparkMaster("local").getOrCreate()
+
+ new Pipeline()
+ .setInput[String]("id_of_product1", classOf[ProductFactory])
+ .setInput[String]("dataframe", classOf[DataFrameFactory])
+ .addStage[ProductFactory]()
+ .addStage[DatasetFactory](Array(spark))
+ .addStage[DataFrameFactory](Array(spark))
+ .addStage[DatasetFactory4](Array(spark))
+ .run()
+ .showDiagram()
+ }
+
 }
 
 object PipelineSuite {
@@ -857,15 +871,28 @@ object PipelineSuite {
 
  override def read(): DatasetFactory4.this.type = this
 
- override def process(): DatasetFactory4.this.type = {
- this
- }
+ override def process(): DatasetFactory4.this.type = this
 
  override def write(): DatasetFactory4.this.type = this
 
  override def get(): Long = ds1.count()
  }
 
+ class DataFrameFactory(spark: SparkSession) extends Factory[DataFrame] {
+ import spark.implicits._
+
+ @Delivery
+ var input: String = null
+
+ override def read(): DataFrameFactory.this.type = this
+
+ override def process(): DataFrameFactory.this.type = this
+
+ override def write(): DataFrameFactory.this.type = this
+
+ override def get(): DataFrame = Seq(input).toDF("column1")
+ }
+
  class PrimaryDeliveryFactory extends Factory[String] {
 
  @Delivery(id = "byte")